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I. Basis of the report 



1 . This report has been drawn on the basis of (Replacement sheets which have been finished to the receiving Office in response to 
under ArUcle 14 are referred to in this report as "originally filed" and are not annexed to the report since L fdo not contain ame 



an mvttation 
report since they do not contain amendments.): 



| | the international application as originally filed. 

1^1 me description, pages N60 f ^ originally filed, 

P a S es , filed with the demand, 

P a g es . filed with the letter of 

P a g es filed with the letter of 



the claims, 



Nos. 
Nos. 
Nos. 
Nos. 
Nos. 



1-34 



. , as originally filed, 
, as amended under Article 19, 

, filed with the demand, 

, filed with the letter of 

, filed with the letter of 



the drawings, 



sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 



1/22-22/22 



. , as originally filed, 
, filed with the demand, 
, filed with the letter of 
, filed with the letter of 



| 2. The amendments have resulted in the cancellation of 

□ the description, pages 

□ the claims, Nos. 

□ the drawings, sheets/fig 



3 Q This report has been established as if (some of) the amendments had not been made, since they have been considered 
I to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 



4. Additional observations, if necessary: 



Form PCT/IPE A/409 (Box I) (January 1994) 



"^^^m"l 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



ational application No. 

PCT/FR98/01136 



III. Non-establishment of opinion with regard to nove lty, inventive step and industrial applicability 

The questions whether the claimed invention appears to be novel, to involve an inventive step (to be non obvious) or to be 
industrially applicable have not been examined in respect of: 

the entire international application. 

claims Nos. 1.34 



because: 

□ the said international application, or the said claims Nos. 
relate to the following subject matter which does not reqi 



require an international preliminary examination (specify: 



rC7| the description claims or drawings (indicate particular elements below) or said claims Nos 
are so unclear that no meamngfiifopinion could be formed (specify): 



1-34 



See the Supplemental Box, 



□ the claims, or said claims Nos. 
by the description that no meaningful opinion could be formed. 

I I no international search report has been established for said claims Nos. 



. are so inadequately supported 
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VI. Certain documents cited 



1. Certain published documents (Rule 70.10) 



Application No. 
Patent No. 



Publication date 
(day/month/year) 



Filing date 
( day/month/year) 



Priority date (valid claim) 
(day/month/year) 



See the Supplemental Box. 



| 2. Non-written disclosures (Rule 70.9) 

Kind of non-written disclosure 



Date of non-written disclosure 
(day/month/year) 



Date of written disclosure 
referring to non-written disclosure 
(day/month/year) 
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I. Basis of the report 

1 . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments,) : 

Preliminary remarks 

In accordance with Rule 13 ter .l(f), any sequence listing 
not contained in the international application as filed 
shall not form part of the international application. 
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Supplemental Box 

(To be used when the space in any of the preceding boxes is not sufficient) 

Continuation of: 1 1 1 . 

The present international preliminary examination report 
does not contain an opinion concerning industrial 
applicability, novelty and inventive step for the 
following reasons : 

The claims in the present application flagrantly violate 
the requirements of PCT Article 6, which stipulates that 
claims must be clear. This applies to the claims taken 
individually or as a whole (cf. PCT Guidelines C-III, 
4.1) . 

Although claims 1 and 22/2 and 23 / 10 and 11 / 30 and 
31 / 33 and 34 have been formulated as distinct 
independent claims, they seem to have the same subject 
matter and to differ from one another only by a variation 
in the definition of the subject matter for which 
protection is sought. Consequently, these claims are not 
concise. Moreover, taken as a whole, they lack clarity 
because, owing to the large number of independent claims, 
it is difficult, if not impossible, to determine the 
subject matter for which protection is sought, and the 
determination by a third party of the scope of protection 
sought necessitates excessive efforts. 

Further, the claims contain many features that are 
optional but are nonetheless repeated in several claims 
(cf . the part concerning GFP, for example) . This makes 
the claims obscure and difficult to read, to say the 
least, and prevents precise characterization of their 
scope (cf . PCT Guidelines C-III, 3.7) . 

The applicant has also made excessive use of functional 
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Int^Bonal application No. 
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Supplemental Box 

(To be used when the space in any of the preceding boxes is not sufficient) 



Continuation of: 1 1 1 



features in the claims (e.g. claim 1, "molecule able to 
absorb the light emitted", see PCT Guidelines C-III, 
2.1). The same observation applies to the definition of 
the invention by the result to be achieved (cf. PCT 
Guidelines C-III, 4.7), which is found in most of the 
claims in the present application (cf. claim 1, "variants 
derived from GFP, by addition,..., provided that these 
variants retain the property of fluorescence") . Finally, 
the essential features of the invention are not clearly 
defined in the claims and the description does not enable 
this aspect to be clarified more precisely (cf. PCT 
Guidelines C-III, 3.4). 

The combination of these breaches of PCT Articles and 
Guidelines prevents the establishment of an opinion 
concerning novelty, inventive step and industrial 
applicability. 
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Certain published documents (Rule 70.10) 



Application No. Publication date Filing date Priority date 

Patent No. (day /month/ year) (day /month/year) (validly claimed) 

(day/mon th/year) 

WO 97/28261 7.8.1997 31.1.1997 31.1.1996 

The applicant's attention is drawn to the fact that the 
document mentioned above, which enjoys a priority date 
earlier than that of the present application, will be 
able to be used in the European regional phase in so far 
as its content is relevant. 



This examination report assumes that all claims enjoy the 
right of priority as of the filing date of the priority 
document. Should this later prove not to be the case, the 
following document - Nature, vol. 388, 1997, p. 882-887, 
cited in the international search report - could become 
relevant . 
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VII. Certain defects in the international application 




The following defects in the form or contents of the international application have been noted: 

1. Contrary to the requirements of PCT Rule 

5.1(a) (ii), the description does not indicate the 
relevant prior art contained in documents D1-D3 and 
does not cite these documents. 

2. The reference to figure 12b on page 52 is not 
correct (cf . pages 43 and 52) . 

3. The application number cited on page 1, line 22, 
violates PCT Guidelines C-II, 4.17. 
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Vm Certain observations on the international application 

The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 

1. The claims in the present application are not clear 
(PCT Article 6) . The fluorescent proteins that are 
the subject of the present invention are cnidarian 
proteins with parameters defined e.g. in claim 1 
(more than 14000 M^.cirf 1 and more than 0.38 
fluorescence quantum yield) . The protein BFP is, on 
the one hand, excluded from this definition (cf. 
description in the application, page 11, line 11) 
and, on the other hand, forms part of the invention 
(cf. description of the application, page 4, line 21 
and page 33, line 8, and see PCT Guidelines C-III, 
4.3) . 

2. PCT Guidelines C-III, 2.1 stipulates that the claims 
must be drafted in terms of the technical features 
of the invention. References to scientific 
publications are not technical features (e.g. claim 
26) . Moreover, in claims 8, 14 and 25, the use of 
the term particularly ( "notamment" ) makes the 
references optional and said references have no 
limiting effect on said claims (PCT Article 6, Rule 
6) . 

3. Claims 1-3, 5, 6 and 22-24 are not clear for the 
following reasons (PCT Article 6) . The introductory 
part of said claims refers to fluorescent cnidarian 
proteins defined by their molecular extinction 
coefficient of more than 14000 M^.cm" 1 and their 
fluorescence quantum yield of more than 0.38. Since 
the use of the term particularly has no limiting 
effect on said fluorescent proteins, it follows that 
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VIIL Certain observations on the international application 



said claims are not limited to GFP, contrary to what 
seems to be suggested in the part of said claims 
dealing with detection. The claims therefore 
contain a contradiction which prevents their scope 
from being determined. 



4. The feature of claim 30 according to which cells or 
cell fragments comprising the gene coding for a 
fluorescent substance fused with a ligand gene are 
claimed is not mentioned in the description. Claim 
30 is not, therefore, supported by the description, 
as required under PCT Article 6. 



5. The use of parentheses and square brackets in the 
claims should be limited to cases where it is 
absolutely necessary (cf. PCT Guidelines C-III, 
4.11). It is not clear whether these parentheses 
and square brackets have a limiting effect on the 
claims contained in them (PCT Article 6) . 

6. Claim 7 does not meet the requirements of PCT 
Article 6. A choice of two different types of 
fluorescent protein can be used in claim 7, either 
EGFP or ECFP. However, the introductory part of 
this claim does not mention the fluorescent protein 
ECFP. 



7. Claims 15 and 16 are not clear (PCT Article 6). 

These two claims mention a marked substance. The 

claims do not, however, describe the marked 

substance but only the marker (Bodipy and coumarin) . 



8. Claim 32 is not clear (PCT Article 6). The claimed 
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kit apparently contains a target protein coupled 
with any fluorescent protein (cf . page 79, line 7) . 
However, the fluorescent protein previously 
described in the claim is selected from among 
fluorescent cnidarian proteins having the indicated 
optical properties. 

The terms particularly, eta.., such that ("tel/telle 
que") and possibly ( "eventuellement" ) used in claims 
1, 2, 4-8, 10, 11, 13, 14, 17-23, 25, 27, 28, 31 and 
32 are vague and ambiguous, and give rise to doubt 
as to the meaning of the technical features to which 
they refer. The same observation applies to the 
term about ("environ"), used to define the molecular 
extinction coefficient of more than 14000 M' 1 . cm -1 and 
the fluorescence quantum yield of the 
autof luorescent cnidarian proteins of more than 0.38 
in claims 1, 2, 4, 6, 10, 11, 21-24, 27 and 29-32. 
The subject of said claims is not, therefore, 
clearly defined (PCT Article 6 and Guidelines C-III, 
4 . 5a and 4.6). 
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j Document brevet cite 
au rapport de recherche 


Date de 
publication 


Membre(s) de la 
famille de brevet(s) 


Date de 
publication 


WO 9101305 A 


07-02-91 


aii /"AT /I C Aft A 

AU 6054590 A 
CA 2064766 A 
EP 0484369 A 
JP 5501862 T 
US 5683888 A 


LL Ul 31 

23-01-91 
13-05-92 

UO V*T JJ 

04-11-97 


WO 9641166 A 


19-12-96 


US 5661035 A 
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21-07-93 


CA 2087413 A 
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EP 0537270 A 
W0 9200388 A 


21-04-93 
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US 5625048 A 
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AU 4155096 A 
EP 0804457 A 
W0 9623810 A 


21-08-96 
05-11-97 
08-08-96 
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B. DOMAINES SUR LESQUELS LA RECHERCHE A PORTE 



Documentation minimale consultee (systeme de classification suivi des symboles de classement) 

CIB 6 G01N C12Q C12N 



Documentation consultee autre que la documentation minimale dans la mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 



Base de donnees electronique consultee au cours de la recherche internationale (nom de la base de donnees, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorte 



Identification des documents cites, avec, le cas 6ch6ant, I'indication des passages pertinents 



no, des revendications visees 



p,x 



p,x 



WO 97 28261 A (UNIV. CALIFORNIA; AURORA 
BIOSCIENCES CORP) 7 aoQt 1997 
voir le document en entier 

MIYAWAKI A ET AL: "Fluorescent indicators 

for Ca-2+ based on green fluorescent 

proteins and calmodulin." 

NATURE (LONDON) 388 (6645). 1997. 882-887. 

ISSN: 0028-0836, XP002058386 

voir page 886, colonne 2 

-/— 



1-34 



1-34 



Voir la suite du cadre C pour la fin de la liste des documents 



Les documents de families de brevets sont indiques en annexe 



* Categories speciales de documents cites: 

"A" document definissant I'etat general de la technique, non 
considers comme particulierement pertinent 

"E" document anterieur, mais publie a la date de d6p6t international 
ou apres cette date 

"L" document pouvant jeter un doute sur une revendication de 
priority ou cite pour determiner la date de publication d'une 
autre citation ou pour une raison speciale (telle qu'indiquee) 

"O" document se rdferant a une divulgation orale, a un usage, a 
une exposition ou tous autres moyens 

"P" document publie avant la date de depot international, mais 
posterieurement a la date de priorite revendiquee 



document ulterieur public apres la date de depot international ou la 
date de priorite et n'appartenenant pas a I'etat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la theorie constituent la base de I'invention 

document particulierement pertinent; I'inven Hon revendiquee ne peut 
etre conside>6e comme nouvelle ou comme impliquant une activity 
inventive par rapport au document consider^ isolement 

document particulierement pertinent; I'inven tfon revendiquee 
ne peut etre conside>6e comme impliquant une activity inventive 
lorsque le document est associe a un ou plusieurs autres 
documents de meme nature, cette combinaison Mant evidente 
pour une personne du metier 

document qui fait partie de la meme famille de brevets 



Date a laquelle la recherche internationale a 3te effectivement achevee 



30 decembre 1998 



Date d'exp^dition du present rapport de recherche internationale 



08/01/1999 



Nom et adresse postale de I'administration chargee de la recherche internationale 
Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rljswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 



Fonctionnaire autorisS 



Fletcher, A 



Formulaire PCT/ISA/210 (deuxteme feuille) (juillet 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Oemande Internationale No 

PCT/FR 98/01136 



C.(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie ° Identification des documents cites, avecle cas echeant, IMndicationdes passages pertinents 



no. des revendications visees 



x 

Y 



ROMOSER V A ET AL: "Detection in living 
cells of Ca-2+-dependent changes in the 
fluorescence emission of an indicator 
composed of two green fluorescent protein 
variants linked by a calmodulin - binding 
sequence: A new class of fluorescent 
indicators . " 

JOURNAL OF BIOLOGICAL CHEMISTRY 272 (20). 
1997. 13270-13274. ISSN: 0021-9258, 
XP002058387 

voir le document en entier 

PETUSHK0V V N ET AL: "Direct measurement 
of excitation transfer in the protein 
complex of bacterial lucif erase 
hydroxyflavin and the associated yellow 
fluorescence proteins from Vibrio fischeri 
Yl . " 

BIOCHEMISTRY 35 (25). 1996. 8413-8418. 
ISSN: 0006-2960, XP002058388 
voir le document en entier 

MITRA R D ET AL: "Fluorescence resonance 

energy transfer between blue-emitting and 

red-shifted excitation derivatives of the 

green fluorescent protein." 

GENE (AMSTERDAM) 173 (1). 1996. 13-17. 

ISSN: 0378-1119, XP004042847 

voir le document en entier 

W0 91 01305 A (UNIV WALES MEDICINE) 7 
fevrier 1991 

voir exemples 3,7 



W0 96 41166 A (UNIV CALIFORNIA ;TSIEN 

ROGER Y (US); GONZALEZ JESUS E III (US)) 
19 decembre 1996 

voir page 33, ligne 30 - ligne 35 

US 5 342 789 A (CHICK WILLIAM L ET AL) 30 
aoQt 1994 

voir le document en entier 

EP 0 552 108 A (UNIV MARYLAND) 21 juillet 
1993 

voir le document en entier, 



-/-- 



1-34 



1-34 



1-34 



1-4,6, 

10,11, 

17,18,32 

5,7-9, 

13-16, 

19-21, 

29,33 

1-11, 

13-21, 

29,32,33 



1-11, 

13-21, 

29,32,33 



1-11, 

13-21, 

29,32,33 



Fomnulalre PCT/ISA/210 (suit© de la deuxieme feuille) (juillet 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Demande Internationale No 

PCT/FR 98/01136 



C.(suite) DOCUMENTS CONSIDERES COM ME PERTINENTS 



Categorle ° Identification des documents cites, avecie cas echeant, Hndicationdes passages pertinents 



no. des revendications vis^es 



US 5 439 797 A (TSIEN ROGER Y ET AL) 8 
aoQt 1995 

voir le document en entler 

US 5 625 048 A (TSIEN ROGER Y ET AL) 29 
avril 1997 

voir le document en entier 



1-11, 

13-21, 

29,32,33 



FormuJalre PCT/ISA/210 (suite de la deuxieme feuille) (Juillet 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 

Renseignements relatifs aux membresde families de brevets 



Demande Internationale No 

PCT/FR 98/01136 



Document brevet cite 
au rapport de recherche 



Date de 
publication 



Membre(s) de la 
famille de brevet(s) 



Date de 
publication 



WO 9728261 



07-08-1997 



AU 
EP 



2250497 A 
0877805 A 



22-08-1997 
18-11-1998 



WO 


9101305 


A 


07- 


-02- 


-1991 


AU 


6054590 


A 


22-02-1991 














CA 


2064766 


A 


23-01-1991 














EP 


0484369 


A 


i 3-05-1992 














JP 


5501862 


T 


08-04-1993 














US 


5683888 


A 


04-11-1997 


wo 


9641166 


A 


19- 


-12- 


-1996 


US 




A 


?fi-flft-1 QQ7 














AU 


6264396 


A 


30-12-1996 














CA 


2223927 


A 


19-12-1996 














EP 


0834074 


A 


08-04-1998 


us 


5342789 


A 


30- 


-08- 


■1994 


EP 




A 
rt 
















WO 


9109312 


A 


27-06-1991 


EP 


0552108 


A 


21- 


-07- 


1993 


CA 


2087413 


A 


18-07-1993 














JP 


6066802 


A 


11-03-1994 














US 


5631169 


A 


20-05-1997 


US 


5439797 


A 


08- 


-08- 


1995 


AT 


170980 


T 


15-09-1998 














DE 


69130171 


D 


15-10-1998 














EP 


0537270 


A 


21-04-1993 














WO 


9200388 


A 


09-01-1992 


US 


5625048 


A 


29- 


-04- 


1997 


AU 


4155096 


A 


21-08-1996 














EP 


0804457 


A 


05-11-1997 














JP 


10509881 


T 


29-09-1998 














WO 


9623810 


A 


08-08-1996 














US 


5777079 


A 


07-07-1998 



Formulaire PCT/1SA/210 (annexe families de brevets) (juillet 1992) 



TRAIT?; DE COOPERATION EN MATIERE DE BREVETS 



PCT 



RAPPORT DE RECHERCHE INTERNATIONALE 



(article 18 et regies 43 et 44 du PCT) 



Reference du dossier du deposant ou 
du mandataire 

W0B97 CNR FLU 



Demande internationale n° 
PCT/FR 98/01136 



POUR SUITE voir ,a notification de transmission du rapport de recherche internationale 
(formulaire PCT/ISA/220) et, le cas ech^ant, le point 5 ci-apres 

A DONNER 



Date du depot international (jour/mois/ann£e) 

04/06/1998 



(Date de priority (la plus ancienne) 
(jour/mois/annee) 

05/06/1997 



Deposant 



CENTRE NATIONAL DE LA RECHERCHE SCIENT. 



,et al . 



Le present rapport de recherche internationale, etabli par radministration chargee de la recherche internationale, est transmis au 
deposant conformement a I'article 18. Une copieen est transmise au Bureau international. 



Ce rapport de recherche internationale comprend . 



. feuilles. 



[")("[ || est aussi accompagne d'une copie de chaque document relatif a I'etat de la technique qui y est cite. 



1 . Q II a ete estime que certaines revendications nepouvaient pas faire I'objet d'une recherche(voir le cadre I). 

2. Q II y a absence d'unite de l'invention(voir le cadre II). 

3. [~~| La demande internationale contient la divulgation d'un listage de sequence de nucleotides oud'acides amines et la 

recherche internationale a ete effectuee sur la base du listage de sequence 

depose avec la demande internationale 

fourni par le deposant separement de la demande internationale 

| | sans etre accompagnee d'une declaration selon laquelle il n'inclut pas d'elements 
altant au-dela de la divulgation faite dans la demande internationale telle 
qu elle a ete deposee. 



□ 

□ 



| | transcrit par ('administration 



4. En ce qui concerne le titre,[j[] le texte est approuve tel qu'il a ete remise parle deposant. 

| | Le texte a ete etabli par I'administration et a la teneur suivante: 



5. En ce qui concerne I'abrege, 

□ 



le texte est approuve tel qu'il a ete" remis parle deposant 

le texte (reproduit dans le cadre III) a ete etabli par I'administration conformement a la 
regie 38.2b). Le deposant peut presenter des observations a I'administration dans un d^lai 
d'un mois a compter de la date d'expedition du present rapport de recherche internationale. 



6. La figure des dessins a publier avec I'abrege est la suivante: 

Figure n° — [^J suggeree par le deposant. 

| | parce que le deposant n'a pas suggere de figure. 
| | parce que cette figure caracterise mieux ('invention. 



□ 



Aucune des figures 
n'est a publier. 



Formulaire PCT/ISA/210 (premiere feuille) (juillet 1992) 



RAPPORT DE RECHERCHE INTERNATIONALE 



Demande Internationale No 

PCT/FR 98/01136 



A. CLASSEMENT DE L'OBJET OE LA DEMANDE 

CIB 6 G01N33/58 C12Q1/25 C12N5/10 C12Q1/37 



Selon la classification internationals des brevets (CIB) ou a la fois selon la classification nationals et la CIB 



B. DOMAINESSUR LESQUELS LA RECHERCHE A PORTE 



Documentation minimale consults© (system© de classification suivi des symboles de classement) 

CIB 6 G01N C12Q C12N 



Documentation consultee autre que !a documentation minimale dans la mesure ou ces documents relevent des domaines sur lesquels a porte la recherche 



Base de donnees electronique consultee au cours de la recherche Internationale (nom de (a base de donnees, et si realisable, termes de recherche utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 



Identification des documents cites, avec, le cas echeant, Vindication des passages pertinents 



no. des revendications vis^es 



p,x 



WO 97 28261 A (UNIV. CALIFORNIA; AURORA 
BIOSCIENCES CORP) 7 aout 1997 
voir le document en entier 

MIYAWAKI A ET AL: "Fluorescent indicators 

for Ca-2+ based on green fluorescent 

proteins and calmodulin." 

NATURE (LONDON) 388 (6645). 1997. 882-887 

ISSN: 0028-0836, XP002058386 

voir page 886, colonne 2 

-/— 



1-34 



1-34 



| X I Voir la suite du cadre c P° ur la fin d ® f a '"St© des documents 



Les documents de families de brevets sont indiques en annexe 



Categories speciales de documents cites: 

"A" document d^finissant I'etat general de la technique, non 
considere comme particulierement pertinent 

"E" document anterieur, mais public a la date de depot international 
ou apres cette date 

document pouvant jeter un doute sur une revendication de 
priorite ou cite pour determiner ta date de publication d'une 
autre citation ou pour une raison sp^ciale (telle qu'indiquee) 
"O" document se referant a une divulgation orale, a un usage, a 

une exposition ou tous autres moyens 
P" document public avant la date de depot international, mais 
posterieurement a la date de priorite revendiquee 



"T" document ulterieur publie apres la date de depdt international ou la 
date de priorite et n'appartenenant pas a I'dtat de la 
technique pertinent, mais cite pour comprendre le principe 
ou la th^orie constituant la base de Tinvention 

"X" document particulierement pertinent; I'inven tion revendiquee ne peut 
etre consideree comme nouvelle ou comme impliquant une activity 
inventive par rapport au document considere isolement 

"Y" document particulierement pertinent; Nnven tion revendiquee 

ne peut etre consideree comme impliquant une activite inventive 
lorsque le document est assocte a un ou plusieurs autres 
documents de meme nature, cette combinaison etant ^vidente 
pour une personne du metier 

document qui fait partie de la meme famille de brevets 



Date a laquelle la recherche internationale a ete effectivement achevee 

30 decembre 1998 


Date d'expedition du ptesent rapport de recherche internationale 

08/01/1999 


Nom et adresse postale de Tadministration charged de la recherche internationale 
Office Europeen des Brevets, P.B. 5818 Patentlaan 2 
NL - 2280 HV Rtjswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 


Fonctionnaire autoris^ 

Fletcher, A 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Demande Internationale No 



PCT/FR 98/01136 



C.(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie ° 


Identification des documents cites, avec.le cas echeant, I'indicationdes passages pertinents 


no. des revendications vis^es 


Y 


ROMOSER V A ET AL: "Detection in living 
cells of Ca-2+-dependent changes in the 
fluorescence emission of an indicator 
composed of two green fluorescent protein 
variants linked by a calmodulin - binding 
sequence, m new class ot t i uorescent 
indicators . " 

JOURNAL OF BIOLOGICAL CHEMISTRY 272 (20). 
1997. 13270-13274. ISSN: 0021-9258, 
XP002058387 

voir le document en entier 


1-34 


Y 


PETUSHKOV V N ET AL: "Direct measurement 
of excitation transfer in the protein 
complex of bacterial lucif erase 
nyaroxyt I avi n ana tne associaxea ye mow 
fluorescence proteins from Vibrio fischeri 
Yl." 

BIOCHEMISTRY 35 (25). 1996. 8413-8418. 
ISSN: 0006-2960, XP002058388 
voir le document en entier 


1-34 






Y 


MITRA R D ET AL: "Fluorescence resonance 

energy LranoTer uetween uiue eiiiittiny ariu 

red-shifted excitation derivatives of the 

green fluorescent protein." 

GENE (AMSTERDAM) 173 (1). 1996. 13-17. 

ISSN: 0378-1119, XP004042847 

voir le document en entier 


1-34 


X 
Y 


WO 91 01305 A (UNIV WALES MEDICINE) 7 
fevrier 1991 

voir exemples 3,7 


1-4,6, 

in 11 

17,18,32 
5,7-9, 
13-16, 
19-21, 

9Q ^7 
cry , JJ 


Y 


WO 96 41166 A (UNIV CALIFORNIA ;TSIEN 
ROGER Y (US); GONZALEZ JESUS E III (US)) 
19 decembre 1996 

voir page oj, ngne ou — iigne od 


l-n, 

13-21, 
29,32,33 


Y 


US 5 342 789 A (CHICK WILLIAM L ET AL) 30 
aout 1994 

voir le document en entier 


1-11, 

13-21, 

29,32,33 


Y 


EP 0 552 108 A (UNIV MARYLAND) 21 juillet 
1993 

voir le document en entier 

-/— 


1-11, 

13-21, 

29,32,33 



Foimulaire PCT/ISA/21 0 (siite de la deuxieme feuille) (juiilet 1992) 
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RAPPORT DE RECHERCHE INTERNATIONALE 



Demande Internationale No 

PCT/FR 98/01136 



C.(suite) DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie * Identification des documents cites, avec.le cas echeant, I'indicationdes passages pertinents 



no. des revendications visees 



US 5 439 797 A (TSIEN ROGER Y ET AL) 8 
aout 1995 

voir le document en entier 

US 5 625 048 A (TSIEN ROGER Y ET AL) 29 
avril 1997 

voir le document en entier 



1-11, 

13-21, 

29,32,33 



Formulaim PCT/ISA/21 0 (siite de la deuxiSme feuille) (juillet 1 992) 



page 3 de 3 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 


International Application No 

PCT/FR 98/01136 


Patent document 
cited in search report 


Publication 
date 


Patent family 
member(s) 


Publication 
date 



WO 9728261 A 07-08-1997 AU 2250497 A 22-08-1997 

EP 0877805 A 18-11-1998 



W0 9101305 A 07-02-1991 AU 6054590 A 22-02-1991 

CA 2064766 A 23-01-1991 

EP 0484369 A 13-05-1992 

JP 5501862 T 08-04-1993 

US 5683888 A 04-11-1997 



WO 


9641166 


A 


19- 


12- 


1996 


US 


5661035 


A 


26-08-1997 














AU 


6264396 


A 


30-12-1996 














CA 


2223927 


A 


19-12-1996 














EP 


0834074 


A 


08-04-1998 


us 


5342789 


A 


30- 


-08- 


1994 


EP 


0505479 


A 


30-09-1992 














WO 


9109312 


A 


27-06-1991 



EP 0552108 A 21-07-1993 CA 2087413 A 18-07-1993 

JP 6066802 A 11-03-1994 
US 5631169 A 20-05-1997 



US 5439797 A 08-08-1995 AT 170980 T 15-09-1998 

DE 69130171 D 15-10-1998 

EP 0537270 A 21-04-1993 

WO 9200388 A 09-01-1992 



US 5625048 


A 


29-04-1997 


AU 


4155096 


A 


21-08-1996 








EP 


0804457 


A 


05-11-1997 








JP 


10509881 


T 


29-09-1998 








WO 


9623810 


A 


08-08-1996 








US 


5777079 


A 


07-07-1998 



Form PCT/ISA/210 (patent family annex) (July 1992) 




TRAITE DE COOPERATION EN MATIERE DE BREVETS 

PCT 

RAPPORT D'EXAMEN PRELIMINAIRE I 



recd 2 7 AUG 1999 



(article 36 et regie 70 du PCT) 



Reference du dossier du deposant ou du 
mandataire 


voir la notification de transmission du rapport d'examen 
POUR SUITE A DONNER preliminaire international (formulaire PCT/IPEA/416) 


Demande internationale n° 
PCT/FR98/01136 


Date du depot international (jour/moi$/ann6e) 
04/06/1998 


Date de priority (jour/mois/ann6e) 
05/06/1997 


Classification international© des brevets (CIB) 
G01 N33/58 


ou a la fois classification national© et CIB 


Deposant 

CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE et al 



1 Le present rapport d'examen preliminaire international. eiaDii par laomim^.a™, v,„a, y ^ ^ r ._ 
international, est transmis au deposant conformement a I'article 36. 

2. Ce RAPPORT comprend 8 feuilles, y compris la presente feuille de couverture. 

□ II est accompagne d'ANNEXES, c'est-a-dire de feuilles de la description, des revendications ou des dessins qui ont 
etfrnodS It qui serve* de base au present rapport ou de feuilles contenant des rectifications fartes aupres de 
?r d ^tra?ion bargee de I'examen preliminaire international (voir la regie 70.16 et I'instruct.on 607 des Instructions 

administratives du PCT). 

Ces annexes comprennent feuilles. 



3. Le present rapport contient des indications relatives aux points suivants: 



I 




Base du rapport 


II 
III 


□ 


Priorite 

Absence de formulation d'opinion quant a la nouveaute, I'activite inventive et la possibilite 
d'application industrielle 


IV 
V 


□ 
□ 


Absence d'unite de I'invention 

Declaration motivee selon I'article 35(2) quant a la nouveaute, I'activite inventive et la possibilite 
d'application industrielle; citations et explications a I'appui de cette declaration 


VI 




Certains documents cites 


VII 
VIII 


® 


Irregularites dans la demande internationale 
Observations relatives a la demande internationale 



Date de presentation de la demande d'examen preliminaire 
internationale 

14/12/1998 



Date d'achevement du present rapport 



Norn etadresse postal© de ('administration chargee de 
I'examen preliminaire international: 

^- Office europeen des brevets 

/fift D-80298 Munich 

ZIP' T6I. (+49-89) 2399-0 Tx: 523656 epmu d 
Fax: (+49-89) 2399-4465 



Fonctionnaire autoris6 

Renggli, J 

N° de telephone (+49-89) 2399 




Formulaire PCT/IPEA/409 (feuille de couverture) (janvier 1994) 



pSnaStIrNAT.ONAL Q^n de ^ona,en- PCT/FR98/01 1 36 



I. Base du rapport 

pas de modifications.) : 

Description, pages: 

1_60 version initials 

Revendications, N°: 

-1 .34 version initiale 

Dessins, feuilles: 

1/22-22/22 version initiale 

2. Les modifications ont entrain^ I'annulation : 

□ de la description, pages : 

□ des revendications, n os : 

□ des dessins, feuilles : 

(regie 70.2(c)) : 
4. Observations complementaires, le cas echeant : 



„,. Absence de formation d'opinion quant a .a nouveaute, .activite inventive et .a possibi.ite d apphcation 
industrielle 



inventive (ne pas etre 
ce qui concerns : 

□ Tensemble de la demande international. 
K les revendications n os 1-34. 



Formulaire PCT/IPEA/409 (cadres l-VIII, feuille 1) Qanvier 1994) 



RAPPORT D'EXAMEN 

PRELIMINAIRE INTERNATIONAL Demande intemationale n° PCT/FR98/011 36 



parce que : 



□ la demande Internationale, ou les revendications n os en question, se rapportent a I'objet suivant, a I'egard 
duquel I'administration chargee de I'examen preliminaire international n'est pas tenue effectuer un examen 
preliminaire international {precise/) : 



H la description, les revendications ou les dessins (en indiquer les elements ci-dessous), ou les revendications 
n os 1-34 en question ne sont pas clairs, de sorte qu'il n'est pas possible de formuler une opinion valable 
{precise/) : 
voir feu i He separee 

□ les revendications, ou les revendications n os en question, ne se fondent pas de fa$on adequate sur la 
description, de sorte qu'il n'est pas possible de formuler une opinion valable. 

□ il n'a pas ete etabli de rapport de recherche intemationale pour les revendications n os en question. 



VI. Certain documents cites 

1 . Certains documents publies (rdgle 70.10) 
et /ou 

2. Divulgations non Scrites (regie 70.9) 
voir feuille separee 



VII. Irregularites dans la demande intemationale 

Les irregularites suivantes, concemant la forme ou le contenu de la demande intemationale, ont 6X6 constatees 
voir feuille separee 

VIII. Observations relatives a la demande intemationale 

Les observations suivantes sont faites au sujet de la clarte des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent entierement sur la description : 

voir feuille separee 



Formulaire PCT/IPEA/409 (cadres I- VIII, feuille 2) (janvier 1994) 



RAPPORT D'EXAMEN Demande intemationale n° PCT/FR98/01 1 36 
PRELIMINAIRE INTERNATIONAL - FEUILLE SEPAREE 



Remarques preliminaires: 

En vertu de la regie 13ter.1 f), tout listage de sequences qui ne figure pas dans 
demande Internationale telle qu' elle a ete deposee ne fait pas partie de la 
demande intemationale. 



Section III: 



La presente rapport d'examen preliminaire international ne contient pas d'opinion 
concernant I'applicabilite industries, la nouveaute et I'inventivite pour les raisons 
suivantes: 

Les revendications de la presente demande contreviennent de fagon flagrante 
aux conditions enoncees dans I'article 6 PCT qui stipulent que les revendications 
doivent etre claires. Ceci s'applique aux revendications prises individuellement ou 
dans leur ensemble (cf. Directives C-lll, 4.1 PCT). 

En effet, bien que les revendications 1 et 22 / 2 et 23 / 10 et 1 1 / 30 et 31 / 33 et 
34 aient ete redigees sous forme de revendications independantes distinctes, il 
semble qu'elles aient le meme objet et qu'elles ne different I'une de I'autre que par 
une variation dans la definition de I'objet pour lequel la protection est demandee. 
Par consequent, ces revendications ne sont pas concises. De plus, prises dans 
leur ensemble, elles sont denuees de clarte, car du fait de la pluralite des 
revendications independantes, il est difficile, voire impossible de determiner I'objet 
pour lequel une protection est demandee, et la delimitation par un tiers de 
I'etendue de la protection demandee necessite des efforts excessifs. 

De plus, les revendications contiennent une multitude de caracteristiques 
optionnelles qui sont neanmoins repetees dans de nombreuses revendications 
(cf. partie concernant la GFP p. ex.) . Ceci rend les revendications obscures, rend 
la lecture de celles-ci pour le moins ardue et ne permet pas de caracteriser 
precisement leur etendue (cf. Directives C-lll, 3.7 PCT). 
Le demandeur a egalement fait recours de fagon exageree dans les 
revendications a des caracteristiques fonctionnelles (e.g. revendication 1 , 
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molecule susceptible d'absorber la lumiere emise, voir Directives C-lll, 2.1 PCT). 
La meme remarque s'applique a la definition de invention par le resultat 
recherche (cf. Directives C-lll, 4.7 PCT) qui est retrouve dans la plupart des 
revendications de la presente demande (cf. revendication 1, des variants derives 

de la GFP, par addition sous reserve que ces variants conservent la propriete 

de fluorescence). Finalement, les caracteristiques essentielles a I'invention ne 
sont pas clairement definies dans les revendications et la description ne permet 
pas de clarifier ce point plus precisement (cf. Directives C-lll, 3.4 PCT). 

La combinaison de ces manquements aux Directives et Articles PCT ne permet 
pas I'etablissement d'une opinion concernant la nouveaute, I'inventivite et 
I'applicabilite industrielle. 



Section VI 



Certains documents publies (regie 70.10) 

Date de priority 

Demande n° Date de publication Datededeptt (valablement revendiquee) 

Brevet n° (jour/mois/annte) (jour/mois/ann6e) (jour/mois/annte) 



WO 97/28261 7.8.1997 31.1.1997 31.1.1996 

L'attention du demandeur est attiree sur le fait que le document mentionne ci- 
dessus, au benefice d'une date de priorite anterieure a la presente demande, 
pourra etre utilise dans la phase regionale europeenne pour autant que son 
contenu soit pertinent. 

Cet examen est fonde sur I'hypothese que toutes les revendications jouissent d'un 
droit de priorite datant du depot du document de priorite. S'il s'averait qu'il n'en 
etait pas ainsi, le document suivant, Nature, vol. 388, 1997, p. 882-887, cite dans 
le rapport de recherche Internationale pourrait devenir pertinent. 
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Section VII 

1 . Contrairement a ce qu'exige la regie 5.1 a) ii) PCT, la description n'indique pas 
I'etat de la technique anterieure pertinent expose dans les documents D1-D3 et 
ne cite pas ces documents. 

2. La reference a la figure 12b a la page 52 n'est pas correcte (cf. pages 43 et 52). 

3. Le numero duplication cite a la page 1 , ligne 22 contrevient aux Directives C-ll, 
4.17 PCT. 

Section VIII 

1 . Les revendications de la presente demande ne sont pas claires (Art. 6 PCT). Les 
proteines fluorescentes objet de la presente invention sont les proteines de 
cnidaires presentant les parametres definis e.g. dans la revendication 1 (plus de 
14000 M Vcrrv 1 et plus de 0,38 de rendement quantique de fluorescence). La 
proteine BFP est, d'une part exclue de cette definition (cf. description de la 
demande, page 11, ligne 1 1) et d'autre part, fait partie de I'invention (cf. 
description de la demande, page 4, ligne 21 et page 33, ligne 8 et voir Directives 
C-ll I, 4.3 PCT). 

2. Les directives PCT, C-lll, 2.1 stipulent que les revendications doivent exposer les 
caracteristiques techniques de I'invention. Les references a des publications 
scientifiques ne sont pas des caracteristiques techniques (e.g. revendication 26). 
De plus, dans les revendications 8, 14 et 25 I'emploi du terme notamment rend les 
references optionnelles et celles-ci n'ont pas de portee limitative sur lesdites 
revendications (Art. 6, Regie 6 PCT). 

3. Les revendications 1-3, 5, 6, 22-24 ne sont pas claires pour les raisons suivantes 
(Art. 6 PCT). La partie introductive desdites revendications fait reference a des 
proteines fluorescentes de cnidaires definies par leur coefficient d'extinction 
moleculaire superieur a 14000 MVcnr 1 et le rendement quantique de 
fluorescence superieur a 0.38. L'emploi du terme notamment n'ayant pas de 
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fonction limitative sur lesdites proteines fluorescentes, il s'ensuit que lesdites 
revendications ne sont pas limitees a la GFP, contrairement a ce qu'il semble 
etre suggere dans la partie consacree a la detection des dites revendications. 
Ainsi, les revendications comportent une contradiction qui ne permet pas de 
determiner leur etendue. 

4. La caracteristique de la revendication 30, selon laquelle des cellules ou fragments 
de cellules comprenant le gene codant pour une substance fluorescente 

f usionnee avec le gene d'un ligand sont revendiquees, n'est pas mentionnee dans 
la description. La revendication 30 ne se fonde done pas sur la description, 
comme I'exige I'article 6 PCT. 

5. L'emploi de parentheses et crochets dans les revendications doit etre limite aux 
cas ou cela est absolument necessaire (cf. Directives, C-lll, 4.1 1 PCT). II n'est pas 
clair si ces parentheses et crochets sont limitatifs pour les revendications en 
contenant (Article 6 PCT). 

6. La revendication 7 ne satisfait pas aux conditions enoncees dans I'article 6 PCT. 
Deux types differents de proteine fluorescente sont utilises a choix dans la 
revendication 7, soit EGFP ou ECFP. Cependant, la partie introductive de cette 
revendication ne fait pas mention de la proteine fluorescente ECFP. 

7. Les revendications 15 et 16 ne sont pas claires (article 6 PCT). Ces deux 
revendications font mention d'une substance marquee. Ces revendications ne 
decrivent cependant pas la substance marquee mais le marqueur seul (Bodipy et 
coumarine). 

8. La revendication 32 n'est pas claire (article 6 PCT). La trousse revendiquee 
contient apparemment une proteine cible couplee a une proteine fluorescente 
guelconaue (nf. paae 79. liane 7) . Cependant, la proteine fluorescente decrite 
auparavant dans la revendication est choisie parmi des proteines fluorescentes de 
cnidaires ayant les proprietes optiques indiquees. 

9. Les termes notamment. etc.... tel/telle que, et eventuellement utilises dans les 
revendications 1, 2, 4-8, 10, 1 1, 13, 14, 17-23, 25, 27, 28, 31 et 32 sont vagues et 
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equivoques, et laissent un doute quant a la signification des caracteristiques 
techniques auxquelles ils se referent. La meme remarque s'applique au terme 
environ employe pour definir le coefficient d'extinction moleculaire superieur a 
14000 M '.cm"' et le rendement quantique de fluorescence superieur a 0.38 des 
proteines autofluorescentes de cnidaires dans les revendications 1, 2, 4, 6, 10, 
11, 21-24, 27, 29-32. L'objet desdites revendications n'est done pas clairement 
defini (article 6 PCT et directives C- III, 4.5a et 4.6 PCT). 
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1 . Le present rapport d'examen preliminaire international, etabli par I'administaration chargee de I'examen preliminaire 
international, esttransmis au deposant conformement a l'article 36. 



2. Ce RAPPORT comprend 8 feuilles, y compris la pr6sente feuille de couverture. 
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administratives du PCT). 
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I IS Base du rapport 

II □ Priorite 

III £3 Absence de formulation d'opinion quant a la nouveaute, Pactivite inventive et la possibilite 

d'application industrielle 

!V □ Absence d'unite de I'invention 

V □ Declaration motivee selon Particle 35(2) quant a la nouveaute, ('activity inventive et la possibilite 

d'application industrielle; citations et explications a Pappui de cette declaration 
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1. Base du rapport 

1 . Ce rapport a ete r^dige sur la base des elements ci-apres (les feuilles de remplacement qui ont ete remises a 
{'office recepteur en reponse a une invitation faite conformement a l* article 14 sont considerees, dans le present 
rapport, comme "initialement deposees" etne sont pas jointes en annexe au rapport puisqu'eiies ne contiennent 
pas de modifications.) : 

Description, pages: 

1-60 version initiale 

Revendications, N°: 

1-34 version initiale 

Dessins, feuilles: 

1/22-22/22 version initiale 

2. Les modifications ont entraine I'annulation : 

□ de la description, pages : 

□ des revendications, n os : 

□ des dessins, feuilles : 

3. □ Le present rapport a 6X6 formula abstraction faite (de certaines) des modifications, qui ont 6X6 considerees 

comme allant au-dela de ('expose de I'invention tel qu'il a ete depose, comme il est indique ci-aprds 
(rdgle 70.2(c)) : 

4. Observations complementaires, le cas echeant : 



III. Absence de formulation d'opinion quant a la nouveaute, I'activite inventive et la possibility d'application 



La question de savoir si Pobjet de I'invention revendiquee semble etre nouveau, impliquer une activite 
inventive (ne pas etre evident) ou etre susceptible d'application industrielle n'a pas ete examinee pour 
ce qui concerne : 

□ I'ensemble de la demande intemationale. 

E les revendications n os 1 -34. 
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parce que : 



□ la demande intemationale, ou les revendications n os en question, se rapportent a I'objet suivant, a regard 
duquel ('administration chargee de I'examen preliminaire international n'est pas tenue effectuer un examen 
preliminaire international (pr6ciser) : 



IS la description, les revendications ou les dessins (en indiquerles elements ci-dessous), ou les revendications 
n os 1-34 en question ne sont pas clairs, de sorte qu'il n'est pas possible de formuler une opinion valable 



voir feuille separee 

□ les revendications, ou les revendications n os en question, ne se fondent pas de fa$on adequate sur la 
description, de sorte qu'il n'est pas possible de formuler une opinion valable. 

□ il n'a pas ete etabli de rapport de recherche intemationale pour les revendications n os en question. 

VI. Certain documents cites 

1 . Certains documents publies (rdgle 70.10) 
et / ou 

2. Divulgations non ecrites (regie 70.9) 
voir feuille separee 

VII. Irregularites dans la demande intemationale 

Les irregularites suivantes, concernant la forme ou le contenu de ia demande intemationale, ont ete constatees : 
voir feuille separee 

VIII. Observations relatives a la demande intemationale 

Les observations suivantes sont faites au sujet de la Claris des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent entierement sur la description : 

voir feuille separee 



(precise/) : 
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Remarques preliminaires: 

En vertu de la regie 13ter.1 f), tout listage de sequences qui ne figure pas dans la 
demande intemationale telle qu' elle a ete deposee ne fait pas partie de la 
demande intemationale. 

Section III: 

La presente rapport d'examen preliminaire international ne contient pas d'opinion 
concernant I'applicabilite industrielle, la nouveaute et I'inventivite pour les raisons 
suivantes: 

Les revendications de la presente demande contreviennent de fagon flagrante 
aux conditions enoncees dans I'article 6 PCT qui stipulent que les revendications 
doivent etre claires. Ceci s'applique aux revendications prises individuellement ou 
dans leur ensemble (cf. Directives C-lll, 4.1 PCT). 

En effet, bien que les revendications 1 et 22 / 2 et 23 / 10 et 1 1 / 30 et 31 / 33 et 
34 aient ete redigees sous forme de revendications independantes distinctes, il 
semble qu'elles aient le meme objet et qu'elles ne different Tune de I'autre que par 
une variation dans la definition de I'objet pour lequel la protection est demandee. 
Par consequent, ces revendications ne sont pas concises. De plus, prises dans 
leur ensemble, elles sont denuees de clarte, car du fait de la pluralite des 
revendications independantes, il est difficile, voire impossible de determiner I'objet 
pour lequel une protection est demandee, et la delimitation par un tiers de 
I'etendue de la protection demandee necessite des efforts excessifs. 

De plus, les revendications contiennent une multitude de caracteristiques 
optionnelles qui sont neanmoins repetees dans de nombreuses revendications 
(cf. partie concernant la GFP p. ex.) . Ceci rend les revendications obscures, rend 
la lecture de celles-ci pour le moins ardue et ne permet pas de caracteriser 
precisement leur etendue (cf. Directives C-lll, 3.7 PCT). 
Le demandeur a egalement fait recours de fagon exageree dans les 
revendications a des caracteristiques fonctionnelles (e.g. revendication 1, 
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molecule susceptible d'absorber la lumiere emise, voir Directives C-lll, 2.1 PCT). 
La meme remarque s'applique a la definition de I'invention par le resultat 
recherche (cf. Directives C-lll, 4.7 PCT) qui est retrouve dans la plupart des 
revendications de la presente demande (cf. revendication 1, des variants derives 
de la GFP, par addition,..., sous reserve que ces variants conservent la propriete 
de fluorescence). Finalement, les caracteristiques essentielles a I'invention ne 
sont pas clairement definies dans les revendications et la description ne permet 
pas de clarifier ce point plus precisement (cf. Directives C-lll, 3.4 PCT). 

La combinaison de ces manquements aux Directives et Articles PCT ne permet 
pas Petablissement d'une opinion concernant la nouveaute, I'inventivite et 
I'applicabilite industrielle. 

Section VI 

Certains documents publies (regie 70.10) 

Date de priority 

Demande n° Date de publication Date de ddpdt (vatablement revendiqu£e) 

Brevet n° (jour/mois/ann6e) (jour/mois/ann6e) Q'our/mois/ann4e) 

WO 97/28261 7.8.1997 31.1.1997 31.1.1996 

L'attention du demandeur est attiree sur le fait que le document mentionne ci- 
dessus, au benefice d'une date de priorite anterieure a la presente demande, 
pourra etre utilise dans la phase regionale europeenne pour autant que son 
contenu soit pertinent. 

Get examen est fonde sur I'hypothese que toutes les revendications jouissent d'un 
droit de priorite datant du depot du document de priorite. SMI s'averait qu'il n'en 
etait pas ainsi, le document suivant, Nature, vol. 388, 1997, p. 882-887, cite dans 
le rapport de recherche Internationale pourrait devenir pertinent. 
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Section VII 

1. Contrairement a ce qu'exige la regie 5.1 a) ii) PCT, la description n'indique pas 
I'etat de la technique anterieure pertinent expose dans les documents D1-D3 et 
ne cite pas ces documents. 

2. La reference a la figure 12b a la page 52 n'est pas correcte (cf. pages 43 et 52). 

3. Le numero d'application cite a la page 1 , ligne 22 contrevient aux Directives C-II, 
4.17 PCT. 

Section VIII 

1 . Les revendications de la presente demande ne sont pas claires (Art. 6 PCT). Les 
proteines fluorescentes objet de la presente invention sont les proteines de 
cnidaires presentant les parametres definis e.g. dans la revendication 1 (plus de 
14000 M~ 1 .crrr 1 et plus de 0,38 de rendement quantique de fluorescence). La 
proteine BFP est, d'une part exclue de cette definition (cf. description de la 
demande, page 1 1 , ligne 1 1) et d'autre part, fait partie de I'invention (cf. 
description de la demande, page 4, ligne 21 et page 33, ligne 8 et voir Directives 
C-lll, 4.3 PCT). 

2. Les directives PCT, C-lll, 2.1 stipulent que les revendications doivent exposer les 
caracteristiques techniques de I'invention. Les references a des publications 
scientifiques ne sont pas des caracteristiques techniques (e.g. revendication 26). 
De plus, dans les revendications 8, 14 et 25 I'emploi du terme notamment rend les 
references optionnelles et celles-ci n'ont pas de portee limitative sur lesdites 
revendications (Art. 6, Regie 6 PCT). 

3. Les revendications 1-3, 5, 6, 22-24 ne sont pas claires pour les raisons suivantes 
(Art. 6 PCT). La partie introductive desdites revendications fait reference a des 
proteines fluorescentes de cnidaires definies par leur coefficient d'extinction 
moleculaire superieur a 14000 M~ 1 .cnv 1 et le rendement quantique de 
fluorescence superieur a 0.38. L'emploi du terme notamment n'ayant pas de 
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fonction limitative sur lesdites proteines fluorescentes, ii s'ensuit que lesdites 
revendications ne sont pas limitees a la GFP, contrairement a ce qu'il semble 
etre suggere dans la partie consacree a la detection des dites revendications. 
Ainsi, les revendications comportent une contradiction qui ne permet pas de 
determiner leur etendue. 

4. La caracteristique de la revendication 30, selon laquelle des cellules ou fragments 
de cellules comprenant le gene codant pour une substance fluorescente 
fusionnee avec le gene d'un ligand sont revendiquees, n'est pas mentionnee dans 
la description. La revendication 30 ne se fonde done pas sur la description, 
comme I'exige I'article 6 PCT. 

5. L'emploi de parentheses et crochets dans les revendications doit etre limite aux 
cas ou cela est absolument necessaire (cf. Directives, C-lll, 4.1 1 PCT). II n'est pas 
clair si ces parentheses et crochets sont limitatifs pour les revendications en 
contenant (Article 6 PCT). 

6. La revendication 7 ne satisfait pas aux conditions enoncees dans I'article 6 PCT. 
Deux types differents de proteine fluorescente sont utilises a choix dans la 
revendication 7, soit EGFP ou ECFP. Cependant, la partie introductive de cette 
revendication ne fait pas mention de la proteine fluorescente ECFP. 

7. Les revendications 15 et 16 ne sont pas claires (article 6 PCT). Ces deux 
revendications font mention d'une substance marquee. Ces revendications ne 
decrivent cependant pas la substance marquee mais le marqueur seul (Bodipy et 
coumarine). 

8. La revendication 32 n'est pas claire (article 6 PCT). La trousse revendiquee 
contient apparemment une proteine cible couplee a une proteine fluorescente 
quelconque (cf. page 79, liqne 7) . Cependant, la proteine fluorescente decrite 
auparavant dans la revendication est choisie parmi des proteines fluorescentes de 
cnidaires ayant les proprietes optiques indiquees. 

9. Les termes notamment etc,— tel/telle que, et eventuellement utilises dans les 
revendications 1, 2, 4-8, 10, 11, 13, 14, 17-23, 25, 27, 28, 31 et 32 sont vagues et 
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equivoques, et laissent un doute quant a la signification des caracteristiques 
techniques auxquelles ils se referent. La meme remarque s'applique au terme 
environ employe pour definir le coefficient d'extinction moleculaire superieur a 
14000 M _1 .cm" 1 et le rendement quantique de fluorescence superieur a 0.38 des 
proteines autofluorescentes de cnidaires dans les revendications 1, 2, 4, 6, 10, 
11, 21-24, 27, 29-32. L'bbjet desdites revendications n'est done pas clairement 
defini (article 6 PCT et directives C-lll, 4.5a et 4.6 PCT). 
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Title: Improvements in or Relating to Gene Expression 
Field of the Invention 

This invention relates to a nucleic acid sequence optimised for expression in a plant cell, 
and to vectors and plant cells comprising the nucleic acid sequence. 

Background of the Invention 

In yeast there is a gene called GAL4, the product of which acts as a transcriptional 
activator (Johnston 1987 Microbiol. Rev. 51, 458-476). The GAL4 gene is quite large 
(3Kb) and the encoded polypeptide comprises an N-terminal DNA-binding domain, a C 
terminal domain having a transcriptional activator function, and an intervening glucose- 
responsive element "GRE" (GAL4 being repressed in the presence of glucose). 

The GAL4 protein has been quite well characterised. Amino acid residues 1-147 of the 
protein bind to DNA in a sequence-specific manner (Keegan et al 1986 Science 22L 699- 
704). The transcriptional activation function is associated with two short portions of the 
C terminal domain (Ma & Ptashne 1987 Cell 48, 847-853). The DNA sequence to which 
GAL4 binds has been identified as a 17mer> which must be present as a repeat for optimal 
GAL4 binding (Giniger et al, 1985 Cell 40, 767-774), and may be referred to as a GAL4- 
responsive "upstream activation sequence * (UAS): GAL4 binds to the UAS 5' of a gene 
by means of the DNA-binding domain, and the C-terminal domain causes up-regulation 
of transcription of the gene. 

Recently, a two-element system has been developed for directing gene expression in 
Drosophila melanogaster \ Brand and Perrimon (1993 Development 118; 401-415,) 
randomly inserted the gene encoding the GAL4 into the Drosophila genome using a P- 
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A large number of stable Drosophila lines were generated which each express GAL4 in 
a particular pattern, dependent on adjacent genomic DNA sequences. A chosen target 
gene could then be cloned under the control of GAL4 upstream activation sequences 
(UAS), separately transformed, and maintained silently in the absence of GAL4. Genetic 
crossing of this single line with any of the library of GAL4-containing lines allowed 
activation of the target gene in many different tissue and cell types, and the phenotypic 
consequences of mis-expression, including those lethal to the organism, could be 
conveniently studied. In addition, the library of GAL4~containing flies has become an 
increasingly characterised and shared resource, and which provides a common entry point 
for various "reverse" genetic techniques. 

A similar system operable in plants would be highly desirable. However, expression of 
heterologous eukaryotic genes in plants has proved highly problematical in the past (see, 
for example, Green Fluorescent Protein) and efficient expression of GAL4 appears equally 
difficult, and it has been suggested that this is due to inefficient translation of GAL4 
mRNA in plants (Reichel et al, 1995 Plant Cell Reports 14, 773-776). Ma et al, (1988 
Nature 334, 631-633) were able to obtain transient expression of modified, functional 
GAL4 derivatives in tobacco-leaf protoplasts but could not demonstrate the presence of 
functional, full-length wild-type GAL4. Similarly, transient expression of GAL4 
derivatives has been demonstrated in maize protoplasts (McCarty et al, 1991 Cell 6§, 895- 
905) and when introduced by biolistic methods, in maize aleurone tissues or embryogenic 
calli (Goff et al 1991 Genes & Dev. 5, 298-309; Goff et al 1992 Genes & Dev. 6, 864- 
875). Hitherto however, there have been no reports of stable, efficient expression of 
functional GAL4 or derivaties thereof in a plant cell. 

It is an aim of the present invention to provide a novel expression system operable in 
plants, utilising a modified portion of the GAL4 gene. 



Summary of the Invention 
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In a first aspect the invention provides a nucleic acid sequence, expressible in a plant cell, 
encoding at least an effective portion of a GAL4 DNA-binding domain, the sequence 
having an A/T base content substantially reduced relative to the wild-type yeast sequence. 

The A/T content of the wild-type yeast sequence encoding the DNA-binding domain of 
GAL4 is about 59%. The % A/T base content of the sequence of the invention encoding 
the effective portion of the GAL4 DNA-binding domain will be understood to be 
substantially reduced when it is less than 50%. Preferably the A/T content is less than 
45%, and more preferably less than 40%. The sequence of the invention may be made, 
for example, by site-directed mutagenesis, or be made de novo by chemical synthesis. 

An "effective portion" of the DNA-binding domain is a portion sufficient to retain most 
(i.e. over 50%) of the DNA-binding activity of the full length DNA-binding domain. 
Typically the "effective portion" will comprise at least two thirds of the full length 
sequence of the DNA-binding domain. Conveniently the nucleic acid sequence will 
encode substantially all of the GAL4 DNA-binding domain (i.e. amino acid residues 1-147 
of the yeast polypeptide), although a substantially smaller portion (about 75 amino acid 
residue) is quite adequate to retain most of the DNA-binding activity (Kraulis et al, 1992 
Nature 356, 448-450; and Marmorstein et al, 1992 Nature 356, 408-414). In one 
particular embodiment, the sequence will comprise the nucleotide sequence shown in the 
5' portion (nucleotides I to about 460) of Figure 1, which sequence has a substantially 
reduced A/T content (38%), relative to the wild-type yeast sequence, yet encodes an 
identical amino acid sequence. 

The GAL4 DNA-binding domain has no transcriptional activation function in its own 
right. Thus, in preferred embodiments, the sequence encoding the effective portion of the 
GAL4 DNA-binding domain will be operably linked to one or more other nucleic acid 
sequences, which sequences may be structural (i.e. encode functional polypeptides) and/or 
regulatory. Typically the sequence encoding the DNA-binding domain will be operably 
linked (e.g. fused in-frame) to a sequence encoding a peptide or polypeptide with a 
regulatory function, preferably a transcriptional activator. The transcriptional activator 
may be the activation domain of GAL4 protein, the sequence encoding which should 
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preferably be optimised for expression in plants (e.g. by reducing the A/T content 
thereof). Alternatively, the transcriptional activator could be any one of a number of such 
proteins known to be active in plants, which will be well-known to those skilled in the art, 
such that the sequence of the invention encodes a chimeric polypeptide, comprising at least 
an effective portion of the GAL4 DNA-binding domain and a transcriptional activation 
domain. A particularly suitable transcriptional activator domain is that obtainable from 
herpes simplex virus (HSV) VP-16, (see Greaves and O'Hare 1989 J. Virol 6J, 1641- 
1650; VP, being also known as VMW65). Other transcriptional activation domains 
include certain peptides encoded by E, coli genomic DNA fragments (Ma & Ptashne 1987 
Cell 51, 113-119) or synthetic peptides designed to form amphiphilic a-helix (Giniger & 
Ptashne 1987 Nature 330, 670-672). A common feature appears to be the requirement for 
excess charge, either positive (Gill & Ptashne 1987 Cell 51 , 121-126) or, more especially 
for plant activation domains, excess negative charge (Estruch et aU 1994 Nucl. Acids Res. 
22, 3983-3989). With this in mind, the person skilled in the art could readily synthesise, 
or find naturally-occurring sequences, which encode peptides or polypeptides with 
transcriptional activation activity in plants. Such activator sequences may, in any event, 
be modified for optimal activity in a plant cell. 

In a further aspect the invention provides a nucleic acid construct, comprising the nucleic 
acid sequence defined above. In one particular embodiment, the nucleic acid construct 
could be used as an "enhancer-trap" to "fish" for plant enhancer sequences (Cf. 
Sundaresan et al f 1995 Genes & Dev. % 1797-1810). In such an embodiment, the 
construct will preferably include right and left Ti-DNA, to allow for random, stable 
insertion into the genome of a plant cell host. The construct will preferably comprise a 
naive plant promoter sequence, by which term is meant a promoter (operable in a plant 
cell) which requires the presence of a suitable enhancer sequence to cause substantial 
levels of transcription. Such a "naive" promoter may be thought of as an "enhancer- 
dependent" promoter, and essentially corresponds to the TATA box region of known plant 
promoters. "Plant" promoters includes reference to viral and bacterial promoter sequences 
which are active in a plant cell (e.g. nucleotides -48 to +1 of the CaMV 35S promoter). 
The naive promoter is conveniently substantially adjacent to one Ti border, the promoter 
being in competent relationship with the sequence encoding the GAL4 DNA-binding 
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domain fused with a transcription activation domain operable in plants such that, should 
the promoter become inserted in the plant host cell genome in functional relationship with 
an enhancer sequence, the promoter will direct the expression of the GAL4 DNA-binding 
domain and the transcriptional activation domain. The construct may additionally 
comprise a plant selectable marker (e.g. Kanamycin resistance) for convenience. 

Additionally, the construct may comprise a reporter gene active in plants (such as Green 
Fluorescent Protein, or /J-glucuronidase "GUS") in operable linkage to a GAL4-responsive 
upstream activation sequence (UAS), such that the reporter gene will be expressed in 
response to synthesis of the GAL4 DNA-binding domain/transcriptional activator fusion 
protein. Preferably the reporter gene is modified GFP as disclosed in WO 96/27675, or 
GUS (conveniently with a nuclear localisation signal). Preferably the UAS comprises one 
or more repeats of the 17mer to which GAL4 binds (Giniger et al % 1985 Cell 40, 767- 
774). 

As an alternative method of introducing the GAL4 binding domain/transcriptional activator 
sequence into a plant host cell genome, the construct may comprise Ds ("dissociation") 
elements, which may then be moved about the genome by the action of a transiently- 
expressed Ac (Activator) enzyme (e.g. Cocherel et al, 1996 Plant Mol. Biol. 30, 539- 
551). 

In a further aspect, the invention provides a plant or part thereof (e.g. a plant host cell or 
cell line) comprising the construct defined above. Typically the construct will have 
become integrated into a plant cell genome and be stably maintained therein. In particular 
the invention provides a plurality of plants or parts thereof (such as isolated plant cells, 
or cell lines, or tissue cultures) comprising a library, each plant or part thereof comprising 
a stably maintained nucleic acid sequence encoding an effective portion of the GAL4 
DNA-binding domain as defined above. Conveniently the nucleic acid sequence will be 
incorporated into the genome of plant cells present in the library. 

The library of plants or pans thereof thus provides a very useful resource. The library 
may be e.g. Arabidopsis thaliana, or of any other plant which is routinely used in 
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research. Each plant or pan thereof in the library may have a particular pattern of 
expression of the integrated reporter gene (see t for example, Sundaresan et ai f 1995 
Genes & Dev. 9, 1797-1810; Klimyuk et aL, 1995 Molec. Gen. Genet. 249, 357-365). 
Thus, introduction of a further gene, having a GAL4-responsive UAS into the cell line, 
will result in expression of the introduced gene in the same temporal/spatial pattern as the 
reporter gene, such that researchers can express a particular gene of interest in selected 
tissues and/or at selected times in a predictable manner. 

The invention thus provides a method of expressing a gene of interest in a known 
(predictable) pattern in a plant or part thereof, the method comprising: introducing the 
gene of interest into the plant or part thereof, said gene of interest having a GAL4- 
responsive upstream activation sequence (UAS), characterised in that said plant or part 
thereof comprises a reporter gene expressed in a known pattern under the influence of a 
transcriptional activator comprising an effective portion of a GAL4 DNA-binding domain 
encoded by a sequence in accordance with the invention defined above, such that binding 
of the transcriptional activator to the UAS causes transcriptional activation of the gene of 
interest. 

The temporal/spatial pattern of expression of the introduced gene or genes of interest will 
then mirror that already known for the reporter gene. Typically the plant or pan thereof 
will be Arabidopsis t ha liana, but may be any other plant which is routinely studied (e.g. 
maize, rice, potato etc). 

Typically the gene or genes of interest will be introduced by crossing GAL4-expressing 
plant cell lines with a plant cell line comprising the gene(s) of interest linked to a GAL4- 
responsive UAS. 

The nucleic acid sequence of the invention has other useful applications, in addition to use 
as an "enhancer trap", or to direct the expression of a gene or genes of interest in a 
predictable manner. The modified GAL4 DNA-binding domain/transcriptional activator 
may also be used to co-ordinate the expression of a plurality of genes of interest. In many 
circumstances it is desirable to express simultaneously a number of genes in a plant either 
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for research purposes, or for agricultural/ industrial motives (e.g. to study metabolic 
pathways, or to manipulate the synthesis of desirable products such as plant dyes or 
lipids). 

Thus, the invention provides a method for co-ordinating the expression of a plurality of 
genes of interest in a plant or part thereof, each of the genes of interest being functionally 
associated with a GAL4-responsive UAS, characterised in that the plant or part thereof 
comprises a sequence in accordance with the first aspect of the invention defined above 
and is capable of expressing a transcriptional activator comprising an effective portion of 
a GAL4 DNA-binding domain, such that binding of the transcriptional activator to the 
UAS causes simultaneous transcriptional activation of all of the genes of interest. 

Conveniently the plurality of genes of interest may all be associated, in a polycistronic 
arrangement, with a single UAS, which facilitates their introduction into the plant or part 
thereof (the genes of interest typically being genes which are not naturally found in the 
plant or part thereof e.g. mammalian or bacterial genes, or genes from a different plant 
or possibly natural plant genes which have been the subject of various modifications). 
Alternatively one or more genes may be operably linked to a respective UAS. The 
transcriptional activator may be encoded by a sequence already present in the plant or part 
thereof, or may be introduced simultaneously with (or subsequent to) introduction of the 
plurality of genes of interest. 

The invention will now be further described by way of illustrative examples and with 
reference to the accompanying drawings, of which: 

Figure 1 shows a nucleotide sequence in accordance with the invention encoding a 
modified GAL4 DNA-binding domain, fused in frame to a sequence encoding a modified 
transcriptional activation domain from HSV VP16, the vertical line denotes the end of the 
GALA DNA-binding domain; 

Figure 2 is a schematic representation of a nucleic acid construct comprising a sequence 
in accordance with the invention; 
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Figure 3 shows the nucleotide sequence of pan of the nucleic acid construct represented 
schematically in Figure 2; and 

Figures 4a-4d show micrographs of roots of plants comprising a sequence in accordance 
with the invention. 

Examples 

The inventors have used an approach similar to that described by Brand & Perrimon 
(1993, cited above), but adapted it for use in Arabidopsis, using Agrobacterium 
tumefasciens - mediated transformation to produce "enhancer trap'* plant cell lines with a 
transcription activator comprising the GAL4 DNA-binding domain, fused to the activation 
domain of HSV VP16 (mGAL4-VP16). 

Example 1 - Construction of mGAL4-VP16 gene 

Eight oligonucleotides, which correspond to the modified sequence of the GAM DNA 
binding region, were synthesised. 

GAL-5' (28-mer) 

GGC AAC AAT GAA GCT ACT GTC TTC TAT C (Seq. ID No. 3) 
VP 16-3' (31-mer) 

GGC AGA TCT ACC CAC CGT ACT CGT CAA TTC C (Seq. ID No.4) 
MGAL1 (109-mer) 

GGC AAG CTT GGA TCC AAC AAT GAA GCT CCT GTC CTC CAT CGA GCA 
GGC CTG CGA CAT CTG CCG CCT CAA GAA GCT CAA GTG CTC CAA GGA 
GAA GCC GAA GTG CGC CAA G (Seq. ID No. 5) 



MGAL2 (108-mer) 

TCC TCT CGA GGG AAG ATC AGG AGG AAG AGC TGC TCC AGG CGC TCC 
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AGG CGG GAC TCC ACT TCG GTG AGG TGG GCG CGG GTC AGC GGG GAG 
CGC TTG GTT TTG GGA GAG (Seq. ID No. 6) 

MGAL3 (81-mer) 

TTC CCT CGA GAG GAC CTC GAC ATG ATC CTG AAA ATG GAC TCC CTC 
CAG GAC ATC AAA GCC CTG CTC ACC GGC CTC TTC GTC (Seq. ID No. 7) 

MGAL4 (89-mer) 

GGG TGA GGG GCA TGT CGG TCT CCA CGG AGG CCA GGC GGT CGG TGA 
CGG CGT CTT TGT TCA CGT TGT CCT GGA CGA AGA GGC CGG TGA GC (Seq. 
ID No. 8) 

MGAL5 (80-mer) 

GGA GAC CGA CAT GCC CCT CAC CCT GCG CCA GCA CCG CAT CAG CGC 
GAC CTC CTC CTC GGA GGA GAG CAG CAA CAA GGG CC (Seq. ID No. 9) 

MGAL6 (83-mer) 

AGT GGA GCT CGT CCC CCA GGC TGA CGT CGG TCG GGG GGG CCG TCG 
AGA CGG TCA ACT GGC GCT GGC CCT TGT TGC TGC TCT CC (Seq. ID No. 10) 

The full-length oligonucleotides were purified by electrophoresis in a 5% polyacrylamide 
gel containing 7M urea and 90mM Tris-borate ImM EDTA pH8.3 (TBE) buffer. The 
fractionated oligonucleotides were detected by brief staining with filtered 0.05% toluidine 
blue dye, excised and eluted overnight at 37°C in 0.5M ammonium acetate, 0.1% SDS 
and 0. ImM EDTA. The eluted DNAs were precipitated and washed with ethanol, and 
phophorylated using T4 plynucleotide kinase. DNAs (0.5ug each) were separately 
resuspended in 50mM Tris-HCl pH 9.0, lOmM MgCl 2 , lOmM DTT with ImM ATP and 
5 units T4 polynucleotide kinase, and incubated for 30 mins at 37 °C. 

The plasmid pCMVGal65 (Cousens et al, 1989 EMBO J. 8, 2337-2342) was used as a 
source of the GAL4-VP16 sequence with unmodified codon usage. Two restriction 
endonuclease fragments were isolated from the plasmid. A SacI-SacI fragment, which 
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contains the sequence encoding the DNA binding element of the Saccharomyces cerevisiae 
GAL4 protein, and a Sacl-Kpnl fragment, which encodes the activation domain of the 
herpes simplex virus VP16 protein, were purified by fractionation and eiution from a low 
gelling temperature (LGT) 1% agarose gel. 

The 5' portion of the mGAL4-VP16 sequence was amplified by the polymerase chain 
reaction (PGR), using the GAL-5' and MGAL2 oligos as primers and the Sad-Sad GAL4 
DNA fragment as a template. Primers and template were incubated under standard 
conditions with VENT DNA polymerase (New England Biolabs) and subjected to 30 
cycles of 94°C for 30 sees, 50°C for 1 min, 72*C for 1 min. The product was cut with 
Xhol restriction endonuclease and purified after electrophoresis through a 1.5% LGT 
agarose gel. 

The MGAL4 and MGAL5 oligonucleotides were annealed by heating to 65 °C and slow 
cooling to room temperature. The MGAL3 and MGAL6 oligonucleotides were then added 
and also annealed to the mixture. The oligonucleotides were then incubated with Klenow 
fragment of DNA polymerase 1 and T4 DNA ligase in 50mM Tris-HCl pH 7.5, lOmM 
MgCl 2 , lOmM DTT, ImM dNTPs and ImM ATP for 60 mins at 37 °C. An excess of 
MGAL3 and MGAL6 oligonuceotides were added, and the mixture was subject to PCR 
amplification, as above. The product was cut with the restriction endonucleases Xhol and 
Sad, and purified after electrophoresis through a 1.5% LGT agarose gel. 

The three gel-purified restriction fragments: (1) the GAL-5 7MGAL2 PCR-amplified 
product, corresponding to the 5* portion of the GAL4 DNA binding domain, (2) the 
MGAL3-6 annealed and amplified product, corresponding to the 3' portion of the GAM 
DNA binding domain, and (3) the Sad-Kpnl fragment from pCMVGal65, corresponding 
to the VP16 activation domain; were mixed and ligated with T4 DNA iigase in 50mM 
Tris-HCl pH 7.5. lOmM MgCl 2 , lOmM DTT and ImM ATP at 20°C overnight. The 
ligated product was PCR amplified (as above) using MGAL1 and VP16-3' as primers. 
The product, containing the entire modified GAL4-VP16 sequence was cut with BamHl and 
ligated to PBI121 (Jefferson et aU EMBO J. 6:3907, 1987) which had been cut with Sad. 
blunt ended by treatment with T4 DNA polymerase, and re-cut with BamHl. The 
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recombinant plasmid (pBIN 35S-mGAL4-VP16) contained the mGAL4-VP16 gene 
downsteam of the constitutive 35S plant promoter. 

In Figure 1, the lower DNA sequence is that of the fusion gene (Seq. ID No. 1), encoding 
in the 5 ' portion the GAM DNA-binding domain, and encoding in the 3' portion the 
transcriptional activation domain from HSV VP16. The wild-type sequence is shown 
above for comparison. It will be seen that the wild type GAL4 DNA-binding domain 
coding sequence is A/T rich (A/T% content is shown on the right for each line of 
sequence), and it is believed that this causes inefficient expression in plants. In particular, 
it is believed that the A/T rich DNA comprises one or more regions which, when 
transcribed, are recognized as mRNA splice sites in plant cells. The altered nucleotides 
are shown outlined in Figure 1. The encoded polypeptide sequence is shown below (Seq. 
ID No. 2). The modifications to the nucleotide sequence were carefully selected to ensure 
that there was no resulting change in the encoded amino acid sequence. The numbers 
above the sequences represent the number of the nucleotide or amino acid at that position. 
Certain restriction endonuclease sites are also shown. 

The 35S promoter and mGAL4-VP16 gene were excised by digestion with the restriction 
endonucleases HinDlll and EcoRI, purified by 1% LGT agarose gel electrophesis, and 
subcloned into a vector containing a GAL4-responsive mgfp5-ER marker gene (see 
Example 2 below). The resulting construct is shown in Figure 2, in which R and L 
represent right and left Ti plasmid border sequence. The GAL4-VP16 fusion gene is 
downstream of the TATA-box region (nucleotides -48 to +1) of the CaMV 35S gene, 
were inserted adjacent to the right Ti border. The plasmid also contains the kanamycin 
resistance (Kan R) selectable marker, and a reporter gene (GUS or GFP) operably linked 
to a synthetic GAL4-UAS promoter sequence. Certain restriction endonuclease sites are 
also shown. 

Figure 3 shows the nucleotide sequence (Seq. ID No. 15) of the plasmid across the 
junctions of the Ti right border, the CaMV35S TATA box, and the start of the GAL4 
DNA-binding domain coding region. 
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The mGAL4-VP 16 gene was directly assayed for activity in transformed Arabidopsis 
plants by Agrobacterium-medi&ted transformation (Valvekens et al Proc. Natl. Acad. ScL 
USA 85:5536-5540, 1988). 

Example 2 

Construction of GAL-GFP enhancer trap vector. 
Modification of the T-DNA right border. 

The plasmid pBIN19 (Bevan, M. Nuc. Acids Res. 12:8711-8721, 1984) was digested with 
the restriction endonuclease SacII, and a 2.6 Kb fragment containing the Agrobacterium 
T-DNA right border sequence was subcloned into &zcll cut pGEM 5Zf(Genbank accession 
No. X65308; commercially available from Promega). The bacteria containing the 
recombinant phagemid were superinfected with helper phage to produce single strand 
phagemid DNA. 

A synthetic mutagenic oligonucleotide ("TR-h"; ATA TCC TGT CAA ACA CTG GAT 
CCG AGC TCC AAT TCA TAG TTT AAA CTG AAG GCG GG; Seq. ID No. 11) was 
kinased and annealed to the purified phagemid DNA, extended on the template using T7 
DNA polymerase, and ligated using T4 DNA ligase. The DNA was transformed into 
bacteria, and recombinant plasmids (pTr+) were screened for the insertion of new sites 
for the restriction endonucleases BamHl, Smal and EcoKl immediately adjacent to the T- 
DNA right border. 

Insertion of TATA box region. 

The TATA box region of the 35S promoter was PCR amplified from pBI121 using 
oligonucleotides complementary to the -48 region of the promoter (oligonucleotide 
A35Sfi«/II; GGC AGA TCT TCG CAA GAC CCT TCC TCT ATA TAA GG: Seq. ID 
No. 12) and the downstream ^-glucuronidase gene (oligonucleotide GUSS/iaBI; CAC ACA 
AAC GGT GAT ACG TA; Seq. ID No. 13). The PCR product was cut with restriction 
endonucleases Bglll and BamHl and ligated to flamHI cut pTr-K The resulting 
recombinant plasmid (pTr+A35S) contained a minimal (naive) promoter positioned 
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Insertion of 35S promoter driven mGAL4-VP 16 gene. 

Derivatives of the GAL4 with unmodified codon usage were inserted into the pTr+A35S 
plasmid in unsuccessful trial experiments, and one of these constructions (the insertion of 
a truncated GAL4 gene derived from pMA236; Ma et al % 1988 Nature 334, 631-633) had 
resulted in the insertion of a unique Hindlll site immediately adjacent to the BamHl site 
in pTR-hA35S. This plasmid, pTr+AGAL4, was digested with restriction endonucleases 
Hindlll and EcoBl, and ligated with the HiriDllhEcoRI fragment from pBIN T>5S-mGAL4- 
VP 16, to introduce the 35S-driven mGAL4-VP 16 gene. The Agrobacterium sequences 
from this plasmid (pTr+35S-mG4L4-V7 > 16) were then recloned into a binary plant 
transformation vector which contained a GAL4-responsive marker gene (see below), for 
testing in ptanta. 

Construction of a synthetic GAL4-responsive promoter. 

A HinDlll-Xbal restriction endonuclease fragment containing five optimised binding sites 
for GAL4 was excised from the plasmid pUAST (Brand & Perrimon, 1993 Development, 
118 . 401-415), and ligated into HinDlll-Xbal cut pBIlOl (Jefeerson et aL y 1987 EMBO 
J. 6, 3901-3907) upstream of the GUS gene (to make pBINAUAS-GUS). A sequence 
corresponding to the -90 region of the 35S promoter was PCR amplified using 
oligonucleotides DELAS1 (GAA CTC TAG AAG CTA CTC CAC GTC CAT AAG GGA 
CAC ATC ACA ATC CCA CTA TCC TTC GC; Seq. ID No. 14) and GUSSrwBI (see 
above). The product was Xbal-BamHl cut and cloned into similarly cut pBIN AUAS- 
GUS. The resulting plasmid (pBIN UAS(-90-ASl)GUS) contains a synthetic GAL4 
promoter upsteam of the 0-glucuronidase (GUS) coding sequence. The GUS gene was 
then replaced with that of the green fluorescent protein (GFP). 

GAL4-responsive mgfp5-ER gene. 

We have extensively mutated the green fluorescent protein gene for optimised expression 
in plants. The optimised gene is called mgfp5-ER (Siemering et al 9 Current Biology 
6:1653-1663, 1996; W096/27675). 
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The mgfp5-ER gene has been cloned into the plant transformation vecto: pBI12L and we 
have excised a BamHl-Sacl fragment, which contains the coding sequence, and have 
inserted this into BamUVSacl cut pBIN UAS(-90-ASl)GUS to replace the GUS gene. 
This plasmid (pBIN UAS(-90-ASl)mgjp5-ER) was cut with Saclh and ligated with the 
Sacll fragment containing the modified T-DNA right border and mGAL4-VP16 gene from 
pTT+35S-mGAL4- VP16, to give pBIN 15S-GAL4-VP16+ \5kS-mgfp5-ER (abbreviated to 
pBIN35S-GAL-GFP). 

Testing of the pBIN35S-GAL-GFP vector. 

The pBIN 35S-GAL-GFP plasmid was introduced into Agrobacterium tumefaciens strain 
LBA4044 (Jefferson etal. , EMBO J. 6:3901-3907, 1987) by electroporation. followed by 
selection on kanamycin-containing plates. The Agrobacterium strain was used to transform 
Arabidopsis using the technique described below. Plants were scored for the GAL4- 
dependent induction of GFP fluorescence after transformation. 

Construction of GAL-GFP enhancer trap vector 

The pTR+35S-mGAL4-VP16 plasmid was treated with BamHl (to excise the 35S promoter 
sequences) and reiigated using T4 DNA ligase. This plasmid (pTR+mGAL4-VP!6) 
contains the modified GAL4-VP16 positioned with a minimal promoter adjacent to the T- 
DNA right border. The T-DNA sequences were then excised by digestion with Sacll, and 
ligated with similarly cut pBIN UAS(-90-AS I)mgfp5-ER. This produced pBIN GAL-GFP, 
which contains the highly active mGAL4-VP16 transcription activator, responsive to 
adjacent enhancer elements, and a GAL4-dependent GFP gene. GFP fluorescence is 
produced in response to GAL4-VP16 activation. 

Enhancer trap screen. 

The enhancer trap vector pBIN GAL-GFP was introduced into Agrobacterium tumefaciens 
(see details below) LBA4044, and has been used to generate over 7,500 transformed 
Arabidopsis seedlings. Transgenic seedlings have been screened directly for GAL4- 
mediated GFP expression, and seeds were collected from expressing plants. We have a 
library of over 250 Arabidopsis lines which show stable inheritable patterns of GAL4- 
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mediated GFP expression in the root. 
Transactivation. 

To demonstrate GAL4-mediated transactivation of a foreign gene we have generated 
transgenic Arabidopsis that contain the T-DNA sequences from pBIN UAS(-90-AS 1)GUS). 
In the absence of GAL4-VP16, these plants do not express the GUS gene. However, 
when genetically crossed with lines expressing the mGAL4-VP16 gene, the GUS gene is 
activated in a pattern of expression which accurately reflects that of the mGAL4-VP16 gene 
from the donor parent (see Example 3 below). 

Example 3 

A stable transformed line (J2302) of Arabidopsis thaliana, which formed pan of the 
library described above, expressed modified GFP (under the influence of the mGAL4- 
VP16 activator) in the cells of the extreme root tip (see Figures 4a and 4b). 

Figure 4a is a low power micrograph showing GFP-mediated epifluorescence (400nm 
excitation) at the root tip. Figure 4b is a higher magnification confocal micrograph 
(488nm excitation) showing the area of GFP-mediated fluorescence in greater detail. 

The line J2302 was crossed (using standard techniques) with another Arabidopsis line 
which comprised a stable, silently-maintained GUS reporter gene operably linked to a 
GAL4-responsive UAS. The product of the cross, as expected, proceeded to express 
GUS, under the influence of the GAL4-VP16 transcriptional activator, in the same pattern 
as the GFP reporter gene in J2302 (i.e. at the extreme root tip). Suitably stained samples, 
imaged by brightfield microscopy, are shown in Figures 4c and 4d, and demonstrate GUS 
reporter gene activity (darkest staining) at the root tip. 

This illustrates that the modified GAL4 DNA-binding domain sequence can 

(i) successfully be used in the construction of enhancer trap vectors; 

(ii) express genes of interest (as exemplified by GUS) in a predictable pattern; and 

(iii) co-ordinate the simultaneous expression of a plurality of genes of interest (as 
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exemplified by GFP and GUS). 
Example 4 

Transformation of Arabidopsis thaliana. 

The methods employed are based on those originally disclosed by Valvekens et aL 1988. 
Proc. Natl. Acad Sci. 85, 5536-5540). 

Media 

Unless otherwise stated all procedures were carried out aseptically using sterile solutions 
and equipment. All media are used in standard plastic disposable petri dishes or, for later 
stages. Magenta GA 7 pots (Magenta Corp., USA). Hormones are dissolved in dimethyl 
sulfoxide (DMSO) as xiOOO stocks. Hormones and antibiotics are added after autoclaving 
and cooling of the media to 65 °C. 

1. Germination medium (GM) comprised: lx Murashige and Skoog salt mixture; 1% 
sucrose; 100 mg/1 inositol; 1.0 rag/I thiamine; 0.5 mg/1 pyridoxine; 0.5 mg/1 nicotinic 
acid; 0.5 g/1 2-(N-morpholino)ethanesulfonic acid (MES); (adjust to pH 5.7 with 1M 
KOH); and 0.8% Difco Bacto agar (for solid GM medium). 

la. GMK50 

As GM, but supplemented with: 50 mg/1 kanamycin (Sigma) 

2. Callus-inducing medium (CIM) comprised: lx Gamborg's B5 medium; 2% glucose; 
0.5 g/I MES (pH 5.7, adjusted with IN KOH); 0.5 mg/1 2,4-D (Sigma); 0.05 mg/1 
kinetin (Sigma); and 0.8 % agar (for solid CIM medium). 

3. Shoot-inducing medium with Vancomycin (SIM V750 K50) comprised: Gamborg's B5 
medium; 2% glucose; 0.5 g/1 MES (pH 5.7); 0.8% agar; 5 mg/1 N6-(2- 
isopentenyOadenine (2ip); 0.15 mg/1 indole-3 -acetic acid (IAA); 750 mg/1 vancomycin; 
and 50 mg/1 kanamycin. 



3a. SIM V500 K50 
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As SIM, but supplemented with: 500 mg/1 vancomycin; and 50 mg/1 kanamycin. 

4. Root-inducing medium (RIM) comprised: Gamborg's B5 medium; 2% glucose; 0.5 g/I 
MES (pH 5.7); 0.8% agar; 12.5 mg/1 indole butyric acid (IBA); and 50 mg/1 cefotaxime. 

Growth of plants 

(i) Place seeds into a 15 ml polypropylene centrifuge tube. 

(ii) Add ethanol for 2 min. Remove ethanol with pipette. 

(iii) Replace with 5% commercial bleach (-0.25% available chlorine) containing one drop 
of NP40 per 50 ml. Leave for 15 min, shaking regularly. 

(iv) Wash seeds in sterile, distilled water for at least three times. 

(v) After last wash, add the sterile seeds to 100ml of GM in a conical flask. Grow with 
shaking for 2-4 weeks in a culture room at 20-25°C. 

Agrobacter ium-mediated transformation . 

1. Day One 

(i) Using a scalpel, cut-off all the green (upper) parts of the plantlets to leave only the root 
systems. 

(ii) Lay out the roots on plates containing solid CIM. Gently press down on each bunch 
of roots to ensure that they are in contact with the surface of the agar. 

(iii) Incubate for 3 d in growth room (22°C, continual light). 

2. Day Four 

(i) After ensuring that there is no visible sign of contamination, collect the callus-induced 
roots in an empty petri dish. 

(ii) Cut the roots into 0.5 cm explants. 

(iii) Add 3-5 ml of Agrobacterium culture which has been grown overnight at 28oC in 
Luria broth, and washed by centrifugation. Swirl with blunt-nosed forceps. Leave to co- 
cultivate for 2min. 

(iv) Blot the roots dry on double-thick sterile filter-paper ( Whatman No. 1) in a petri dish. 

(v) Place the explants onto solidified CIM medium in a petri dish, and gently press them 
onto the surface to ensure contact with the medium. 
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(vi) Incubate plates in the growth room for 2 d to allow co-cultivation of Agrobacterium. 
3. Day Six 

(i) Transfer the explants to a petri dish in 20-25 ml of water. 

Agitate with blunc-nosed forceps to wash off the agrobacteria. The bathing medium should 
become somewhat turbid. Transfer the root pieces to a sieve and repeat the washing. Then 
lift the sieve out of buffer and drain. Press down the explants down onto the mesh to 
remove as much buffer and agrobacteria as possible. Push the semi-dried explants together 
into a mass. 

(Custom-made, autoclavable and re-usable, sieves are used to hold the explants during 
Agrobacterium infections and washings of root explants. These sieves are made from 100 
ml plastic three-cornered beakers and 100 urn nylon mesh. The top 3-4 cm is cut off the 
beaker and the mesh held in place across the bottom of this piece by pushing a ring 2 cm 
high cut from just above the base of the beaker into the lower portion of the top part. 
The two pieces are sealed together by pushing a hot metal rod through them in several 
places.) 

(ii) Blot small bundles of root material on double-thick sterile filter-paper in a petri dish 
until dry and transfer to solidified SIM V750 K50 medium, taking care that root explants 
are in close contact with the medium. 

(iii) Incubate in growth room. 

Regeneration 

(i) In growth room, tiny green kanamycin resistant calli appear on the yellowish root- 
explants after 3 weeks. 

(ii) Every 2 weeks, transfer explants to fresh SIM V750 K50. Shoots (often initially 
vitreous) intermittently appear from the green calli over the next several weeks. 

(iii) Transfer these shoots to RIM, where roots will develop over a period of 2 to 3 weeks 

(iv) After the formation of roots, transfer the plantlets to GM in vented Magenta GA7 pots 
or directly to soil. Ensure that the humidity is kept low to ensure good seed set. 

(v) Harvest seed pods when they turn yellowish-brown and are therefore mature. 



Germination and screening of Fl progeny. 
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To test for transformation, Fl seedlings are germinated on GM K50. 

(i) Put seeds on GM K50 (surface sterilise the seeds if necessary). 

(ii) Put petri dishes in the dark at 4oC (refrigerator) for 3-5 d, to break seed dormancy. 
This is not necessary if seeds were stored for more than a month. 

(iii) Incubate petri dishes in growth room for 2 weeks. Sensitive seedlings form neither 
roots nor leaves, and have white cotyledons. Transformed seedlings are phenotypically 
normal. 

(iv) Transgenic callus and shoots were screened for GFP expression using a inverted 
fluorescence microscope (Leitz DM-IL) fitted with a filter set (Leitz-D excitation BP355- 
425, dichroic 455, emission LP460 ) suitable for the main 395nm excitation and 509nm 
emission peaks of GFP. The use of a 7mm threaded extension tube with a 4x objective 
(EF 4/0 A2) gave a greater working distance, and has allowed the convenient direct 
observation of tissue within inverted sealed petri dishes. A 100 Watt long wavelength 
hand-held UV lamp (UV Products, B100AP) was also used for routine monitoring of 
transgenic shoots and plants. Transgenic Arabidopsis Fl seedlings were grown in sterile 
agar culture for 5 days, and were mounted in water under glass coverslips for microscopy. 
The specimens were examined using a BioRad MRC-600 laser-scanning confocal 
microscope equipped with a krypton-argon laser and filter sets suitable for the detection 
of fluorescein and texas red dyes (BioRad K1/K2), and a Nikon 60x PlanApo N.A. 1.2 
water immersion objective. 
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(1) GENERAL INFORMATION: 

(i) APPLICANT: 

(A) NAME: Medical Research Council 

(B) STREET: 20 Park Crescent 

(C) CITY: London 

(E) COUNTRY: United Kingdom 

(F) POSTAL CODE (ZIP): WIN 4AL 

(G) TELEPHONE: (0171) 636 5422 

(H) TELEFAX: (0171) 323 1331 

(ii) TITLE OF INVENTION: Improvements in or Relating to Gene 
Expression 

(in) NUMBER OF SEQUENCES: 15 

(iv) COMPUTER READABLE FORM: 

(A) MEDIUM TYPE: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) OPERATING SYSTEM: PC -DOS /MS -DOS 

(D) SOFTWARE: Patentln Release #1.0. Version #1.30 (EPO) 



(2) INFORMATION FOR SEQ ID NO: 1: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 701 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY : linear 

(ix) FEATURE: 

(A) NAME/ KEY: CDS 

(B) LOCATION: 17.. 694 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1: 

AAGCTTGGAT CCAACA ATG AAG CTC CTG TCC TCC ATC GAG CAG GCC TGC 49 
Met Lys Leu Leu Ser Ser He Glu Gin Ala Cys 
1 5 10 

GAC ATC TGC CGC CTC AAG AAG CTC AAG TGC TCC AAG GAG AAG CCG AAG 97 
Asp lie Cys Arg Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys 
15 20 25 

TGC GCC AAG TGT CTG AAG AAC AAC TGG GAG TGT CGC TAC TCT CCC AAA 145 
Cys Ala Lys Cys Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys 
30 35 40 

ACC AAG CGC TCC CCG CTG ACC CGC GCC CAC CTC ACC GAA GTG GAG TCC 193 
Thr Lys Arg Ser Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser 
45 50 55 
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CGC CTG GAG CGC CTG GAG CAG CTC TTC CTC CTG ATC TTC CCT CGA GAG 241 
Arg Leu Glu Arg Leu Gl u Gin Leu Phe Leu Leu He Phe Pro Arg Glu 
60 65 70 75 

GAC CTC GAC ATG ATC CTG AAA ATG GAC TCC CTC CAG GAC ATC AAA GCC 289 
Asp Leu Asp Met He Leu Lys Met Asp Ser Leu Gin Asp He Lys Ala 
80 85 90 

CTG CTC ACC GGC CTC TTC GTC CAG GAC AAC GTG AAC AAA GAC GCC GTC 337 
Leu Leu Thr Gly Leu Phe Val Gin Asp Asn Val Asn Lys Asp Ala Val 
95 100 105 

ACC GAC CGC CTG GCC TCC GTG GAG ACC GAC ATG CCC CTC ACC CTG CGC 385 
Thr Asp Arg Leu Ala Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg 
110 115 120 

CAG CAC CGC ATC AGC GCG ACC TCC TCC TCG GAG GAG AGC AGC AAC AAG 433 
Gin His Arg lie Ser Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys 
125 130 135 

GGC CAG CGC CAG TTG ACC GTC TCG ACG GCC CCC CCG ACC GAC GTC AGC 481 
Gly Gin Arg Gin Leu Thr Val Ser Thr Ala Pro Pro Thr Asp Val Ser 
140 145 150 155 

CTG GGG GAC GAG CTC CAC TTA GAC GGC GAG GAC GTG GCG ATG GCG CAT 529 
Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His 
160 165 170 

GCC GAC GCG CTA GAC GAT TTC GAT CTG GAC ATG TTG GGG GAC GGG GAT 577 
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp 
175 180 185 

TCC CCG GGG CCG GGA TTT ACC CCC CAC GAC TCC GCC CCC TAC GGC GCT 625 
Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Aia 
190 195 200 

CTG GAT ATG GCC GAC T^C GAG TTT GAG CAG ATG TTT ACC GAT GCC CTT 673 
Leu Asp Met Ala Asd Phe Glu Phe Glu Gin Met Phe Thr Asp Ala Leu 
205 210 215 

GGA ATT GAC GAG TAC GGT GGG TAGATCT 701 
Gly He Asp Glu Tyr Gly Gly 
220 225 

(2) INFORMATION FOR SEQ ID NO: 2: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 226 ammo acids 

(B) TYPE: amino acid 
(D) TOPOLOGY: linear 

(ii) MOLECULE TYPE: protein 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
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Met Lys Leu Leu Ser Ser He Glu Gin Ala Cys Asp He Cys Arg Leu 
15 10 15 

Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu 
20 25 30 

Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro 
35 40 45 

Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu 
50 55 60 

Glu Gin Leu Phe Leu Leu lie Phe Pro Arg Glu Asp Leu Asp Met He 
65 70 75 80 

Leu Lys Met Asp Ser Leu Gin Asp lie Lys Ala Leu Leu Thr Gly Leu 
85 90 95 

Phe Val Gin Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala 
100 105 110 

Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gin His Arg He Ser 
115 120 125 

Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gin Arg Gin Leu 
130 135 140 

Thr Val Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu 
145 150 155 160 

His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp 
165 170 175 

Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly 
180 185 190 

Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp 
195 200 205 

Phe Glu Phe Glu Gin Met Phe Thr Asp Ala Leu Gly He Asp Glu Tyr 
210 215 220 

Gly Gly 
225 



(2) INFORMATION FOR SEQ ID NO: 3: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 28 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
GGCAACAATG AAGCTACTGT CTTCTATC 28 

(2) INFORMATION FOR SEQ ID NO: 4: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 31 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 
(0) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: 

GGCAGATCTA CCCACCGTAC TCGTCAATTC C 31 

(2) INFORMATION FOR SEQ ID NO: 5: 

(i) SEQUENCE CHARACTERISTICS: 
(A) LENGTH: 109 base pairs 
"(8) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: 
GGCAAGCTTG GATCCAACAA TGAAGCTCCT GTCCTCCATC GAGCAGGCCT GCGACATCTG 60 
CCGCCTCAAG AAGCTCAAGT GCTCCAAGGA GAAGCCGAAG TGCGCCAAG 109 

(2) INFORMATION FOR SEQ ID NO: 6: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 108 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6: 
TCCTCTCGAG GGAAGATCAG GAGGAAGAGC TGCTCCAGGC GCTCCAGGCG GGACTCCACT 60 
TCGGTGAGGT GGGCGCGGGT CAGCGGGGAG CGCTTGGTTT TGGGAGAG 108 

(2) INFORMATION FOR SEQ ID NO: 7: 

(i) SEQUENCE CHARACTERISTICS: 
(A) LENGTH: 81 base pairs 
(8) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 



WO 9^/30164 PCT/GB97/00406 

24 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7: 
TTCCCTCGAG AGGACCTCGA CATGATCCTG AAAATGGACT CCCTCCAGGA CATCAAAGCC 60 
CTGCTCACCG GCCTCTTCGT C 81 

(2) INFORMATION FOR SEQ ID NO: 8: 

d) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 89 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS : single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8: 
GGGTGAGGGG CATGTCGGTC TCCACGGAGG CCAGGCGGTC GGTGACGGCG TCTTTGTTCA 60 
CGTTGTCCTG GACGAAGAGG CCGGTGAGC 89 

(2) INFORMATION FOR SEQ ID NO: 9: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 80 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9: 
GGAGACCGAC ATGCCCCTCA CCCTGCGCCA GCACCGCATC AGCGCGACCT CCTCCTCGGA 60 
GGAGAGCAGC AACAAGGGCC 80 

(2) INFORMATION FOR SEQ ID NO: 10: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 83 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10: 
AGTGGAGCTC GTCCCCCAGG CTGACGTCGG TCGGGGGGGC CGTCGAGACG GTCAACTGGC 60 
GCTGGCCCTT GTTGCTGCTC TCC 83 

(2) INFORMATION FOR SEQ ID NO: 11: 

(i) SEQUENCE CHARACTERISTICS: 
(A) LENGTH: 56 base pairs 
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(B) TYPE: nucleic acid 

(C) STRANDEONESS : single 

(D) TOPOLOGY: linear 

SEQUENCE DESCRIPTION: SEQ ID NO: 11: 
ATATCCTGTC AAACACTGGA TCCGAGCTCC AATTCATAGT TTAAACTGAA GGCGGG 56 



(2) INFORMATION FOR SEQ ID NO: 12: 

(l) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 35 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEONESS: single 

(D) TOPOLOGY: linear 

(x1) SEQUENCE DESCRIPTION: SEQ ID NO 
GGCAGATCTT CGCAAGACCC TTCCTCTATA TAAGG 



(2) INFORMATION FOR SEQ ID NO: 13: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 20 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO 
CACACAAACG GTGATACGTA 



(2) INFORMATION FOR SEQ ID NO: 14: 

(i) SEQUENCE CHARACTERISTICS: 
(A) LENGTH : 59 base pairs 
(8) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14: 
GAACTCTAGA AGCTACTCCA CGTCCATAAG GGACACATCA CAATCCCACT ATCCTTCGC 59 



12: 



35 



13: 



20 



(2) INFORMATION FOR SEQ ID NO: 15: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 91 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15k 
TAGGTTTACC CGCCAATATA TCCTGTCAAA CACTGGATCT TCGCAAGACC CTTCCTCTAT 60 
ATAAGGAAGT TCATTTCATT TGGAGAGGAC A 91 
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CLAIMS 

1. A nucleic acid sequence, expressible in a plant cell, encoding at least an effective 
portion of a GAL4 DNA-binding domain, the sequence having a % A/T base content 
substantially reduced relative to the wild-type yeast sequence. 

2. A sequence according to claim 1, further comprising a structural and/or regulatory 
sequence in operable linkage to the sequence encoding the effective portion of the GAL4 
DNA-binding domain. 

3. A sequence according to claim 1 or 2, wherein the nucleic acid encodes a peptide or 
polypeptide, having transcriptional activation activity, in operable linkage with the 
sequence encoding the effective portion of the GAL4 DNA-binding domain. 

4. A sequence according to any one of claims 1, 2 or 3, wherein the sequence encodes 
a peptide or polypeptide, having transcriptional activation activity in a plant cell, which 
is a modified portion of GAL4, VP16, GCN4 or a designed sequence which does not 
naturally occur. 

5. A nucleic acid construct comprising a sequence in accordance with any one of claims 
1-4. 

6. A construct according to claim 5, capable of inserting a sequence according to any 
one of claims 1-4 into the genome of a plant host cell. 

7. A construct according to claim 5 or 6, further comprising a reporter gene in operable 
linkage with a GAL4-responsive upstream activation sequence (UAS). 

8. A construct according to any one of claims 5, 6 or 7, comprising a sequence encoding 
GUS or green fluorescent protein (GFP) suitable for expression in a plant cell. 
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9. A construct according to any one of claims 5-8, comprising T-DNA borders or Ds 
elements. 

10. A construct according to any one of claims 5-9, wherein expression of the sequence 
according to claims 1-4 is under the control of an enhancer-dependent plant promoter. 

11. A construct according to any one of claims 5-10, further comprising a selectable 
marker gene. 

12. A plant or part thereof comprising a nucleic acid sequence according to any one of 
claims 1-4, or transformed with a construct according to any one of claims 5-11. 

13. A plant or part thereof according to claim 12, wherein the sequence is stably 
maintained in the plant genome. 

14. A library comprising a plurality of plants or parts thereof, each plant or pan thereof 
comprising a stably integrated nucleic acid sequence according to claim 3 or claim 4, 
which sequence causes the expression of a reporter gene in a known temporal and/or 
spatial pattern. 

15. A library according to claim 14, made by the introduction of a nucleic acid construct 
according to any one of claims 6-11 into a plurality of plants or parts thereof. 

16. A library according to claim 14 or 15, comprising a plurality of Arabidopsis thaliana 
plants. 

17. A method of expressing a gene of interest in a known pattern in a plant or part 
thereof, the method comprising: introducing the gene of interest into the plant or part 
thereof, said gene of interest having a GAL4- responsive upstream activation sequence 
(UAS), characterised in that said plant or part thereof comprises a reporter gene expressed 
in a known pattern under the influence of a transcriptional activator comprising an 
effective portion of a GAL4 DNA-binding domain encoded by a sequence according to any 
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one of claims 1-4, such that binding of the transcriptional activator to the UAS causes 
transcriptional activation of the gene of interest. 

18. A method according to claim 17, wherein the gene of interest is introduced into one 
or more plants or parts thereof from a library according to any one of claims 14, 15 or 
16. 

19. A method for co-ordinating the expression of a plurality of genes of interest in a plant 
or pan thereof, each of the genes of interest being functionally associated with a GAL4- 
responsive UAS, characterised in that the plant or part thereof comprises a sequence 
according to any one of claims 1-4 and is capable of expressing a transcriptional activator 
comprising an effective portion of a GAL4 DNA-binding domain, such that binding of the 
transcriptional activator to the UAS causes simultaneous transcriptional activation of all 
of the genes of interest. 

20. A method according to claim 19, wherein at least some of the genes of interest are 
arranged polycistronically and associated with a single GAI>4-responsive UAS. 

21. A method according to claim 19, wherein genes of interest are functionally associated 
with respective GAL4- responsive UASs. 
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(57) Abstract 



Disclosed is a DNA sequence encoding Green Fluorescent Protein (GFP), the sequence being modified relative to the wild type 
sequence so as to allow for more efficient expression in a plant cell of a functional GFP polypeptide. Also disclosed is a modified GFP 
polypeptide comprising an amino acid substitution, relative to the wild type protein sequence, which exhibits useful characteristics when 
expressed in many different types of host cell. 
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JELLYFISH GREEN FLUORESCENT PROTEIN (GFP) EXPRESSION IN PLANTS 
Field of the Invention 

This invention relates to improvements in gene expression, especially improvements in 
expression of the Green Fluoresecent Protein (GFP) gene, and to a method of detecting 
the presence and/or expression in a host of a gene of interest. 

Background of the Invention 

Genes encoding ^-glucuronidase and 0-galactosidase have been used as reporters for gene 
expression in plants. Using these reporter genes, transformed tissues or patterns of gene 
expression can be identified histochemically, but this is generally a destructive test and 
is not suitable for assaying primary transformants, nor for following the time course of 
gene expression in living plants, nor as a means of rapidly screening segregating 
populations of seedlings. There is thus a general need for improved reporters of gene 
expression, but especially reporter genes for use in plants. Candidates might be found 
among proteins having intrinsic fluorescence. 



Proteins with high intrinsic fluorescence are involved in photosynthesis and 
bioluminescence, and in most cases possess a protein-bound chromophore. For example, 
the highly fluorescent phycobiliproteins require complex tetrapyrrole groups, and the blue 
and yellow fluorescent proteins from Vibrio fischeri must bind lumazine and flavin 
mononucleotide, respectively. This requirement for an external chromophore complicates 
the use of these proteins as reporters for gene expression. However, the green fluorescent 
protein (GFP) from the jellyfish Aequorea victoria does not share this requirement for an 
external chromophore. 

Aequorea victoria are brightly luminescent, with light appearing as glowing points around 
the margin of the jellyfish umbrella. Light arises from yellow tissue masses which each 
consist of about 6000-7000 photogenic cells (Davenport & Nichol. 1955 Proc. Roy. Soc. 
Ser. B 144. 399-411). The cytoplasm of these cells is densely packed wjth fine granules 
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of about 0.2jim diameter which are enclosed by a unit membrane and contain the 
components necessary for bioluminescence (Anderson & Cormier, 1973 J- Biol. Chem. 
248. 2937-2943). The components include a Ca" activated photoprotein, aequorin, that 
emits blue-green light, and an accessory green fluorescent protein (GFP) which accepts 
energy from aequorin and re-emits it as green light. 

GFP is an extremely stable protein of 238 amino acids. The fluorescent properties of the 
protein are unaffected by prolonged treatment with 6M guanidine HC1, 8M urea or 1% 
SDS, and two day treatment with various proteases such as trypsin, chymotrypsin, 
papain, subtilisin, thermolysin and pancreatin at concentrations up to 1 mg/ml fail to alter 
the intensity of GFP fluorescence. GFP is stable in neutral buffers up to 65°C t and 
displays a broad range of pH stability from 5.5 to 12 (Bokman & Ward, 1981 Biochem. 
Biophys. Res. Comm. 101, 1372-1380). The protein is intensely fluorescent, with a 
quantum efficiency of approximately 80% and molar extinction coefficient of around 
4.5x10*. GFP absorbs light maximally at 395 nm and has a smaller absorbance peak at 
475nm, and fluorescence emission peaks at 509nm, with a shoulder at 540nm (Morise 
et aL, 1974 Biochemistry 13, 2656-2662). Researchers have successfully cloned and 
sequenced both the cDNA and genomic DNA sequences coding for A. victoria GFP 
(Prasher et aL, 1992 Gene 111, 229-233). 

The fluorescence of GFP has been well characterised (Inouye & Tsuji, 1994 FEBS 
Letters 13817, 277-280 and FEBS Letters 14472, 211-214) and appears to be due to a 
unique covalently-attached chromophore which is formed poswranslationally by 
cyclisation and oxidation of the residues 65-67 (Ser-Tyr-Gly) within the protein (Cody 
etaL, 1993 Biochemistry 32, 1212-1218; Heim et aL, 1994 PNAS 91, 12501-12504). 
Several genomic and cDNA clones of gfp have been obtained from a population of A. 
victoria. The gfp gene contains at least three introns, and the sequences derived from the 
cDNA have been used for protein expression studies in Escherichia coli, Caenorhahditis 
elegans fChalfie et at., 1994 Science 263. 802 et seq.) and Drosophila metanogaster 
(Wang & Hazelrigg, 1994 Nature 369, 400 et seq,). Fluorescent protein was produced 
in these different cell types and there appears to be little requirement for specific 
additional factors for post-translational modification of the protein, which may be 
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autocatalytic or require common factors. Recently, modified forms of GFP have also 
been made and studied, which forms have rather different fluorescence characteristics 
compared to the wild type (Heim etal., 1994 PNAS 91, 12501-12504; Delagrave et al., 
1995 Bio/Technology 13, 151 et seq.; and Heim et al., 1995 Nature 373, 663-664). 

Although GFP has some advantages as a fluorescent reporter molecule, expression has 
been reported to be problematic in some experimental systems (Cubitt et al., 1995 Trends 
Biochem. Sci. 20, 448-455). Expression of GFP in mammalian cells has been described 
as highly variable (Rizutto et al.. 1995 PNAS 92, 11899-11903); Kaether & Gerdes 
1995, FEBS Lett. 369, 267-271; Pines 1995, Trends Genet. 11, 326-327) often requiring 
a strong promoter and decreased incubation temperature for good results (Ogawa et al., 
1995 PNAS 92, 11899-11903). Other researchers have found that a lower incubation 
temperature also favours the development of fluorescence during expression of GFP in 
bacteria (Heim et aL, 1994 PNAS 91, 12501-12504; Webb et al., 1995 J. Bact. 177, 
5906-5911) and yeast (Lim et al., 1995 J. Biochem. 118, 13-17). In yeast, this 
phenomenon has been attributed primarily to more efficient maturation of GFP to the 
fluorescent form at lower temperatures. The present inventors have sought to express 
modified forms of GFP in various hosts. 

Summary of the Invention 

In a first aspect the invention provides a DNA sequence encoding Green Fluorescent 
Protein (GFP), the sequence being modified relative to the wild type sequence so as to 
allow for more efficient expression in a plant cell of a functional GFP polypeptide. 
Preferably the modified sequence is capable of efficient expression in a dicotyledonous 
plant, such as Arabidopsis . 

The term 'GFP" as used herein is intended to refer to a polypeptide possessing many of 
the properties of the naturally occurring protein, and particularly exhibiting intrinsic 
fluorescence. As will be apparent to those skilled in the art. the polypeptide need not 
necessarily fluoresce in the "green" pan of the visible spectrum, as the fluorescence 
properties of the polypeptide (including the wavelength of fluorescence) may be 
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substantially altered by one or more mutations. 

The GFP polypeptide will generally have substantially the amino acid sequence of the 
wild type protein (as disclosed by Prasher et al.) % but will preferably comprise one or 
more amino acid differences defined, and discussed in greater detail, below. 

The GFP-coding DNA sequence is advantageously modified so as to reduce the 
probability of an RNA sequence transcribed therefrom being subject to erroneous splicing 
in a plant cell. The DNA sequence is conveniently modified so as to comprise a plurality 
of nucleotide substitutions relative to the wild type sequence, which substitutions serve 
to reduce, or preferably entirely prevent, excision from the transcribed RNA of the 
portion corresponding to nucleotides 400-483 of the DNA sequence. It has surprisingly 
been found by the present inventors that this portion of the sequence tends to be 
recognised in plant cells (particularly dicotyledenous plants) as an intron, which is 
therefore excised by splicing of the RNA. 

Preferably the nucleotide substitutions in the DNA sequence serve to decrease the A/U% 
content of the transcribed RNA, which is believed to decrease the likelihood of the 
sequence being treated by a plant cell as representing an intron. Desirably the 
substitutions particularly decrease the A/U% content of the region corresponding to 
nucleotides 400-483. Conveniently the nucleotide substitutions are such as to preserve 
the amino acid sequence of the encoded polypeptide substantially unchanged in the 
portion encoded by nucleotides 400-483. Other substitutions may advantageously be 
made to decrease the similarity between the GFP RNA sequence and the plant intron 
recognition consensus sequence (see Figure 2). 

In addition to nucleotide substitutions in the portion 400-483 of the DNA sequence, a 
number of other modifications may advantageously be made. For example, substitutions 
may be made downstream (i.e. 3*) and/or upstream (i.e. 5 1 ) of nucleotides 400-483, 
which substitutions will conveniently serve to further reduce the A/U content of the 
transcribed RNA. 
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The invention also includes within its scope RNA sequences capable of being transcribed 
from the modified DNA sequence (i.e. RNA sequences transcribed from the modified 
DNA sequence, or an RNA having a sequence such that it could be synthesised by 
transcription from the modified DNA sequence). 

Advantageously a number of other modifications, in addition to those specified above, 
may also be made to the GFP-coding sequence. For example, the sequence will typically 
further comprise transcription and translation signals (e.g. promoters, enhancers) and/or 
localisation signals recognised in plants. Localisation signals may direct the expressed 
polypeptide to: the nucleus (e.g. SV40 large T antigen localisation signal, particularly in 
combination with other polypeptide sequences, which have been found to increase the 
efficiency of the signalling); mitochondria (e.g. cytochrome C oxidase subunit IV); 
endoplasmic reticulum - ER (e.g. the signal sequence from carboxypeptidase Y, or that 
from Arabidopsis basic chitinase); or microbodies (e.g. peroxisomes). It may even be 
possible to target the modified GFP polypeptide to the plant cell wall. Localisation of 
GFP may be highly desirable when expression occurs at high levels, so as to minimise 
possible toxicity to host cells. 

The sequence may advantageously be further modified in accordance with the manner 
described in the prior an (e.g. as disclosed by Heim et al., 1994, 1995, or Delagrave ex 
aL, 1995, as cited previously). Whilst in general the DNA sequence is modified in such 
a way as to preserve the wild type amino acid sequence, it has been found that amino 
acid changes at specific residues are in fact desirable. In particular, the sequence may 
be modified so as to comprise an amino acid substitution at one or both of amino acid 
residues 163 and 175. Changes at these positions are found to alter the characteristics 
of the polypeptide in an unexpected and favourable manner. 

In particular, amino acid substitutions at residue 163 and/or 175 (valine and serine 
respectively, in the wild type protein) have favourable effects on the characteristics of the 
GFP polypeptide when expressed in many different host cells (e.g. bacterial, yeast etc.). 
and such substitutions may advantageously be included independently of any modification 
of the DNA sequence made for increased efficiency of expression in plants. 
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In a second aspect therefore the invention provides a modified GFP polypeptide 
comprising an amino acid substitution relative to the wild type protein at residue 163 
and/or 175. Substitution at either residue, in isolation, has surprisingly been found to 
increase the thermotolerance of the, polypeptide. Maximal thermotolerance is obtained 
by causing substitution at both residues. 

Advantageously valine 163 is substituted by alanine, or by a related amino acid (i.e. those 
having an aliphatic side chain: glycine, leucine and isoleucine; or those having an 
aliphatic hydronyl side chain: serine and threonine). 

Advantageously serine 175 is substituted by glycine, or by a related amino acid (i.e. 
those having an aliphatic side chain: alanine, leucine and isoleucine; or those having an 
aliphatic hydroxy 1 side chain: serine and threonine). 

It is preferred that the modified GFP polypeptide comprises substitutions at both residues, 
conveniently 163-+alanine and 175-*glycine. 

The modified GFP may additionally comprise other sequence differences relative to the 
wild type protein, particularly in, or immediately adjacent to, residues 65-67 (which 
residues give rise to the chromophore). 

Such a nucleic acid sequence is useful for example, as a marker, or as a reporter gene, 
in a wide variety of host cells (e.g. mammalian, bacterial, fungal, yeast or plant cells). 
Conveniently, the nucleic acid sequence may be further modified for expression in a 
particular host cell. For example, where the thermotolerant GFP-coding sequence is to 
be expressed in a plant cell it will conveniently be modified in accordance with the first 
aspect of the invention. 

In a third aspect, the invention provides a nucleic acid construct comprising a nucleic acid 
sequence in accordance with the first aspect of the invention. In particular the construct 
is preferably an expression vector, comprising one or more regulatory signals (such as 
promoters etc.) and is preferably suitable for use in a plant cell. The construct will 
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desirably include one or more restriction endonuclease sites, suitable for the insertion into 
the construct of other nucleic acid sequences, which in a preferred embodiment may be 
inserted in frame with the sequence of the invention. 

The invention also provides a host cell, conveniently a plant cell, into which has been 
introduced a sequence in accordance with the first aspect of the invention. 

Processes for introducing DNA into plant cells (typically by transformation) are not 
100% efficient. Accordingly, it is generally desirable for the DNA introduced into the 
plant cell to confer one or more distinctive characteristics upon the plant cell, which 
characteristic(s) serve to mark those cells which have taken up the DNA. The fluorescent 
properties of GFP constitute such a distinctive characteristic ("marker"). In a preferred 
embodiment the invention thus provides a plant cell transformation vector comprising the 
sequence of the invention. Further, the invention provides a method of screening plant 
cells, comprising introducing into at least some of a plurality of plant ceils a DNA 
construct comprising a sequence in accordance with the invention, maintaining the cells 
under suitable conditions for an appropriate length of time so as to allow expression of 
a modified GFP from the construct, and selecting those cells which exhibit GFP-raediated 
fluorescence. "Suitable conditions" and "an appropriate length of time" are well known 
to those skilled in the art from standard texts. 

In a preferred embodiment, the vector further comprises a sequence of interest which, 
preferably, is present in frame with the modified GFP-coding sequence. 

In a fourth aspect the invention thus provides a method of detecting the expression in a 
plant of a sequence of interest, comprising causing the sequence of interest to be present 
in frame with a modified GFP-coding sequence in accordance with the first aspect of the 
invention so as to form a modified GFP/sequence of interest fusion, introducing the 
fusion into a plant, and monitoring the fluorescence thereof. GFP-mediated fluorescence 
is thus an indicator of expression of the sequence of interest. 

In yet another aspect, the invention provides a nucleic acid construct comprising a 
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sequence in accordance with the second aspect of the invention. The nucleic acid 
construct will desirably have many of the features of the nucleic acid construct in 
accordance with the third aspect of the invention. It will be apparent however that the 
construct may be useful in many different types of host cell, and may be constructed 
accordingly. 

The invention will now be further described by way of illustration and with reference to 
the accompanying drawings, in which: 

Figure 1A shows the sequences introduced, via PCR, flanking the GFP-coding sequence; 

Figure IB is a confocal micrograph of transformed yeast cells expressing GFP; 

Figure 2A is a photograph showing agarose gel electrophoresis analysis of PGR products; 

Figure 2B is a schematic illustration of the portion of DNA not represented in the mis- 
spliced mRNA produced in plants from the wild type GFP-coding sequence; 

Figure 3A is a photograph showing the DNA sequence determination of the reverse 
transcript produced from mis-spliced mRNA; 

Figure 3B is a comparison between a portion of the GFP wild type sequence and a plant 
intron consensus sequence; 

Figure 4 shows a comparison of pan of the wild type A. victoria GFP sequence with a 
modified GFP-coding sequence in accordance with the invention; 

Figure 5 is a series of confocal micrographs (at different magnification) showing parts 
of a plant expressing a modified GFP-coding sequence in accordance with the invention; 

Figure 6 shows a comparison of pan of three modified GFP-coding sequences in 
accordance with the invention, together with the amino acid sequences encoded thereby; 
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Figure 7 is a graph of relative fluorescence (arbitary units) against time (minutes) for E. 
coli strains expressing modified GFP (open squares) or modified, mutated GFP (filled 
circles); 

Figure 8 is a photograph of a Western blot, probed with anti-GFP antibody; 

Figure 9 is a bar chart showing the amount of fluorescence associated with cultures 
expressing modified GFP (open columns) on modified, mutated GFP (shaded columns) 
incubated at four different temperatures; 

Figure 10 is a graph of fluorescence against time (minutes) for yeast cultures at 25 °C or 
37°C, the cultures having been grown initially in anaerobic conditions, with oxygen 
introduced at time zero; 

Figure 11 is a picture of a Western blot showing expression of modified GFP or 
modified, mutated GFP (GFPA) by E. coli cultures at 25 or 37°C, with comparison 
between soluble and insoluble culture fractions; 

Figure 12 is a graph of absorbance against wavelength for soluble (filled circles) or 
insoluble (open circles) GFP; 

Figure 13 is a picture of yeast cultures, grown at 25 or 37°C and expressing modified 
GFP, or modified, mutated GFP (GFPA); 

Figure 14 is a graph of fluorescence against wavelength (nm), showing the excitation 
spectra (squares) and emission spectra (circles) respectively, of modified GFP (solid 
lines) and two mutated forms of modified GFP, GFPA (dashed lines) and GFP5 (dotted 

lines); 

Figure 15 is a comparison of the nucleotide sequence of wild-type gfp and a modified 
gene m-gfp5, and the polypeptides encoded thereby, Nucleotide sequence differences are 
shown in bold. The m-GFP5 amino acid sequence is shown beneath the nucleotide 
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sequence. The three amino acid differences between the encoded polypeptides are 
indicated; 

Figure 16 shows the sequence of another modified m-gfp gene, termed m-gfp5-ER* and 
the amino acid sequence of the polypeptide encoded thereby; and 

Figure 17 shows a number of confocal micrographs (A-H) of Arabidopsis seedlings 
expressing modified gfp genes in accordance with the invention. 

Examples 

Example 1 

Construction of a gfp expression cassette 

A synthetic gfp gene was constructed using the polymerase chain reaction (PCR). The 
plasmid pGFPlO.l (described by Prasher et aL, 1992 Gene 11 L cited above) contains 
a cloned A. victoria gfp cDNA, and was used as template for PCR amplification (with 
Thermococcus litoralis Vent polymerase) with synthetic oligomer primers which were 
used to incorporate new sequences flanking the GFP coding sequence. 

The sequence of the primer oligonucleotides was: 

GGCGGATCCAAGGAGATATAACAATGAGTAAAGGAGAAGAACITTTCACT (Seq. 
ID No. 1) and GGCGAGCTCTTATTTGTATAGTTCATCCATGCC (Seq. ID No. 2). 

The newly-incorporated sequences are shown in Figure 1A. Referring to Figure 1A, the 
sequence existing in pGFPlO.l is shown italicised. The added sequences are shown in 
normal type. These included: recognition sites for the restriction endonucleases BamHl 
and Sad placed at the 5* and 3' termini of the amplified fragment: a Shine-Delgarno 
ribosome binding site (RBS) sequence positioned upstream of the initiation codon to 
ensure efficient translation of the transcribed gene in E. coli, and the sequence A AC A 
inserted between positions -4 and -1 for efficient translation in plants. 

The PCR-amplified fragment was subcloned into pUC119 for bacterial expression, and 
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into an episomal yeast plasmid vector, pVT103-U (Veraet et al., 1987 Gene 52, 225-233) 
which contains a yeast 2fiM origin of replication and a truncated form of the yeast ADH1 
promoter to allow high level expression of the cloned GFP gene in Saccharomyces 
cerevisiae. S. cerevisiae MGLD-4a (a, leu2. ura3, his3, trpl iys2) cells were 
transformed using the lithium acetate method described by Ito et al. (1983). 

Transformed £. coli and yeast bearing the recombinant plasmid were observed to produce 
brilliantly fluorescent colonies under long wavelength UV illumination using a hand-held 
lamp. Interestingly, a high degree of sectoring was seen in yeast colonies containing the 
episomal form of the gfp cDNA; the sectoring was eliminated by integration of the gfp 
cDNA at the yeast URA3 locus and presumably reflects the instability of the 2/iM-based 
episome and/or some toxic effects of GFP expression. This observation also indicated 
the utility of GFP as a simple cell-autonomous marker. Examination of transformed 
yeast cells by confocal microscopy showed that the protein was predominantly distributed 
throughout the cytoplasm (Fig. IB). 

After the PCR amplified gfp cDNA was shown to correctly produce fluorescent protein 
product in yeast, the sequence was inserted between the BamYLl and Sacl sites in the plant 
transformation vector pBI121 behind the 35S promoter (Jefferson et al., 1987). A. 
tumefasciens strain LBA4044 was transformed with the g/p-comaining plasmid by 
electroporation. Roots of Arabidopsis thaliana C24 were transformed using the protocol 
of Valvekans et al. (1988). Transgenic callus and shoots were screened for GFP 
expression using an inverted fluorescence miscroscope (Leitz DM-IL) fitted with an 
appropriate filter set (Leitz-D). However, at no stage during the transformation 
procedure was GFP-related fluorescence detected by UV lamp illumination, or by 
epifluorescence microscopy. This lack of fluorescence was unexpected and surprising in 
view of the fluorescence exhibited previously by the transformed bacteria and yeast cells. 

gfp is mis-spliced in Arabidopsis 

The successful expression of GFP in Arabidopsis requires proper production of the 
apoprotein, before post-translational modification to form the chromophore. The 
inventors therefore used PCR-based methods to verify the correct insertion of the 35S 
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promoter-driven gfp cDNA, and to check mRNA transcription and processing in 
transformed plantlets. Nucleic acids were extracted from plantlets and either treated with 
RNase, or DNase treated and reverse transcribed using oligo(dT) g primer. The gfp 
sequences in these extracts were therefore derived from genomic DNA or transcribed 
mRNAs, respectively. The gfp sequence was PCR- amplified from these separate extracts 
and products were analysed by restriction endonuclease digestion, as shown in Figure 2A. 

In Figure 2A, the RNase-treated DNA sample ( M mRNA M ) is shown on the left of each 
pair of samples, whilst the DNase- treated/ reverse transcribed sample is shown on the 
right of each pair. The samples were either loaded onto gel without prior restriction 
("uncut", extreme left hand pair of samples) or loaded after prior digestion with (from 
left to right): Ncol\ Rsal; Dra\\ Accl; Hindi; or Avail. It can be seen that whilst the 
expected product was obtained after amplification of the gene, RT-PCR of mRNA 
sequences gave rise to a truncated product. This product was 80-90 base pairs shorter 
than expected and was uncut by the restriction endonucleases Dral and Accl, whilst the 
gene sequences contained unique recognition sites for these enzymes. The inventors 
established that this is consistent with a small deletion within the gfp coding sequence as 
shown in Figure 2B. In this figure, the shaded portion represents that missing from the 
mRNA-derived RT-PCR amplified sequences. 

The shortened RT-PCR product was cloned and sequenced (Fig. 3A), and a deletion of 
84 nucleotides between residues 400-483 was located. The nucleotide sequences 
bordering this deletion are shown in figure 3B, and demonstrate similarity to known plant 
introns. The sequence across the splice site (marked with an arrow in Figure 3 A) thus 
reads (5* to 3 1 ) ...AG/ AC... . Matches were found for important residues at the 5' and 
3* splice sites (reviewed by Luefrsen et a/., 1994) and the excised gfp sequence contains 
a high predicted A:U content (68%) which has also been shown to be important for 
recognition of plant introns (Wiebauer et aL. 1988; Hanley & Schuler, 1988; Goodall & 
Filipowitz. 1989. 1991). It is therefore likely that this 84 nucleotide region of the 
jellyfish gfp cDNA sequence is recognised as an intron when transcribed in Arabidopsis . 
resulting in the production of a defective protein product. It should be noted that the 
borders of this cryptic intron do not coincide with any of the natural spliced junctions 
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found after processing of the gfp mRNA in A. victoria. 
Modification of the gfp gene 

The jellyfish gene was mutated to produce a modified gfp (m-gfp) suitable for expression 
in Arabidopsis, as described below. 

Two mutagenic oligonucleotides were synthesized, a 122-mer: 
GATCATATGAAGCGGCACGACTTCTTCAAGAGCGCCATGCCTGAGGGATACG 
TGCAGGAGAGGACCATCTTCTTCAAGGACGACGGGAACTACAAGACACGTG 
CTGAAGTCAAGTTTGAGGG (Seq. ID No. 3), 

and a 126-mer: 

GATGTATACGTTGTGGGAGTTGTAGTTGTATTCCAACTTGTGGCCGAGGATG 
TTTCCGTCCTCCTTGAAATCGATTCCCTTAAGCTCGATCCTGTTGACGAGGGT 
GTCTCCCTCAAACTTGACTTC (Seq. ID No. 4). 

The oligonucleotides were purified by electrophoresis in a 5% polyacrylamide gel 
containing TBE and 7M urea. The gel was stained briefly with 0.05% toluidine blue, 
and the full-length oligonucleotides were excised, and eluted overnight in 0.5M 
ammonium acetate, O.lmM Na 2 EDTA, 0.1% SDS. The oligonucleotides share 17 
nucleotides of complementarity at their 3' termini, and were annealed and elongated after 
several rounds of thermal cycling with Vent polymerase. The extended product was 
cloned between the Nde I and Acc I sites of gfp. The mutant clones were screened for 
the presence of the diagnostic restriction endonuclease sites, Cla I, Ava II, and the 
desired fragment (m-gfp) was subcloned into M13 and its sequence verified by DNA 
sequencing using the dideoxynucleotide chain termination technique with T7 DNA 
polymerase. 

The modifications introduced by the synthetic oligonucleotides were intended to alter the 
sequences which might be involved in 5' splice site recognition and to decrease the A:U 
content of the putative intron. as shown in Figure 4. In the Figure, the upper DNA 
sequence is that of a portion of the wild type A. vicroria GFP. The lower DNA sequence 
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is that of a portion of a modified GFP-coding sequence. The corresponding amino acid 
sequence is shown beneath the DNA sequences. Modified nucleotides are shown 
outlined. All DNA modifications affect only codon usage, and the /n-g#?-encoded amino 
acid sequence is identical to that of the wild-type jellyfish polypeptide. The "pseudo- 
intron" sequence is underlined and the cryptic splice junctions are arrowed. Nucleotide 
and amino acid residue numbering (on the left and right, respectively, of the oblique 
stroke) start from the initiation codon. The boxed hexanucleotide sequences are Ndel and 
Accl recognition sites respectively. 

The m-gfp sequence was inserted behind the 35S promoter in pBI121 , and introduced into 
Arabidopsis using the root transformation technique. Brightly green fluorescent cells 
were seen after co-cultivation with Agrobacterium. As shoot regeneration progressed, 
explants with different levels of green fluorescence could be observed. Regenerating 
callus and shoots develop a bright red autofluorescence due to the formation of 
chlorophyll within the tissues, and with the brightest m-gfp transformants the green 
fluorescence was clearly detectable against this autofluorescent background using a hand 
held UV lamp. This was similar to the levels of green fluorescence seen in transformed 
yeast and £. coli . However, these very bright Arabidopsis transformants regenerated and 
set seed rather poorly. Nevertheless, seeds were obtained from over 50 transformed 
lines, allowed to germinate, and screened by epifluorescence microscopy. Several of the 
brightest lines were used for confocal laser scanning microscopy. 

Confocal microscopy or living plants 

The fluorescence properties of GFP and chlorophyll allow the use of fluorescence 
microscopes equipped with common filter sets for fluorescein and rhodamine for dual 
imaging in plant cells. Intact five day old m-g^-transformed Arabidopsis seedlings were 
mounted in water for confocal laser scanning microscopy. GFP fluorescence could be 
clearly visualised in the transformed tissues, and chloroplasts provided a very effective 
counter fluor in the upper pans of the plant. Optical sectioning of the m-gfp transformed 
plants gives selective visual access to the internal details of living plant structure, as 
shown in Figure 5. without any need for staining or dissection. For example, median 
longitudinal sections of root tips can be simply obtained by adjusting the microscope 
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depth of iocus, and confocal imaging allows the resolution of subcellular details. GFP 
is found throughout the cytoplasm, but appears to accumulate within the nucleoplasm. It 
appears excluded from vacuoles, organelles and other bodies in the cytoplasm, and is 
excluded from the nucleolus. Similarly, in optical sections of cotyledon and hypocotyl 
tissues, GFP is found throughout the cytoplasm and nucleoplasm. The relationship of 
cells within the tissues is clearly discernible. In highly vacuolate epidermal cells in the 
root and hypocotyl, GFP fluorescence allows visualisation of trans-vacuolate cytoplasmic 
threads, and the thin cytoplasmic strands which underly the cell wall and which may be 
aligned with cytoskeletal elements. The movement of organelles through cytoplasmic 
streaming could also be observed in these living cells. 

Example 2 

Isolation and characterisation of a bright mutant of GFP 

The sequence of m-gjp was mutated by PGR in the presence of limiting nucleotide 
concentrations. The template plasmid was pBSm~gfp4, a derivative of TU#65 (Chalfie 
ex aL y 1994 Science 263, 802-805) in which gfp has been replaced with m-gfp. The 
primers used were the T3 and T7 primers (New England Biolabs) that are complementary 
to the flanking T3 and T7 promoters present in the vector sequence. Four separate 
reactions (30 cycles of 30 seconds at 94°C, 30 seconds at 55°C and 1 min at 72°C using 
Taq DNA Polymerase from Promega) were carried out, each with the concentration of 
a different nucleotide reduced from 200 to 20 pM. The amplified fragments were 
pooled, cleaved with Kpnl and EcoW and cloned downstream of the lac promoter of 
pBluescript II KS (+) (Strategene). 

The mutant library thus obtained was transformed into £. coli strain XLl-Blue 
(Stratagene) and incubated overnight at 37°C on TYE agar containing 50 txglml 
ampictllin and 1 mM IPTG. Colonies were illuminated with a long wavelength UV lamp 
(UVP Model B 100 AP) and visually screened for increased fluorescence. The coding 
regions of two of the brightest mutant genes (m-gfpA and m-gfpB) thus identified, as well 
as that of m-gfp, were amplified by PCR (30 cycles of 1 min at 94°C. 1 min at 55°C and 
1 min ai 72°C using VENT DNA Polymerase from New England Biolabs) using primers 
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that generate a BamHl-Sacl fragment containing the gfp coding sequence downstream of 
a phage Shine-Dalgarno sequence and a plant translation initiation context sequence. The 
forward primer (5'Bam-GFP) was 

5 ' -GGCGGATCCA4 GGA GAT ATAAC AATG AGTAAAGGAGAAGAACTTTTC ACT-3 ' 
(Seq ID No. 5, BamHl site underlined, Shine-Dalgarno sequence in italics and 
translation initiation context sequence in bold) and the reverse primer (GFP-3'Sac) was 
5 ' -GGCGAGCTCTT ATTTGTATAGTTC ATCCATGCC-3 * (Seq ID No. 6, Sacl site 
underlined and GFP stop codon in bold). The amplified fragments obtained from the 
three reactions were cleaved with BamHl and Sacl and cloned downstream of the lac 
promoter of pUC119 (Vieira and Messing, 1987 Methods Enzymol. 153, 3-11). 

The positions of the mutations responsible for the bright phenotypes of m~gfpA and m~ 
gfpB were then localised by recombination of the mutant genes with m~gfp. The pUCl 19 
derivatives containing m-gfpA and m-gfpB were cleaved with either BamHl and JVcol, 
Ncol and CM, or CM and Sacl. The restriction fragments were gel purified and ligated 
to the m-gfp pUC119 derivative that had been cleaved with the same combination of 
enzymes and gel purified. These and the parent constructs were introduced into XL1- 
Blue cells and incubated overnight at 37 °C on agar plates containing ampicillin and 
IPTG. Comparison of the fluorescence of colonies containing the various constructs 
revealed that the mutation(s) responsible for the bright phenotypes of both m-gfpA and 
m-gfpB were contained within the 336 bp Clal-Sacl fragment at the 3' end of the gene. 
These fragments were cloned into the phage vector M13mpl9 (New England Biolabs) and 
sequenced from the Universal primer using the Sequenase Version 2.0 DNA Sequencing 
Kit (United States Biochemical Corporation). 

Sequencing of the Clal-Sacl fragment of m-gfpB revealed the presence of a single coding 
alteration. V163A. This same change was found in combination with a second coding 
alteration. S175G, in the ClahSacl fragment of m-gfpA. The sequences of mGFP, 
mGFPB and mGFPA are compared in Figure 6. whch shows the location of the two 
mutations. The S175G change would appear to contribute to the phenotype of GFPA as 
cells expressing the GFPA protein were clearly more fluorescent than those expressing 
GFPB (data not shown). Thus, only GFPA was analysed further. 
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The sequence of the m-gfp gene was modified so as to code for the VI 63 A and S175G 
substitutions described above and the I167T substitution described in the prior an (1994 
Heim et al., Proc. Natl. Acad. Sci. USA 9L 12.501-12,504, which substitution inverts 
the ratio of the 400-475nm excitation peaks), as well as to further alter the codon usage 
of the gene in order to eliminate potential plant intron sequences generated by the 
introduction of these mutations. The sequence differences between this modified gene 
termed, m-gfp5 t and the original gfp gene, and their respective polypeptides are 
summarised in Fig. 15 (Seq. ID Nos. 5-8). 

The m-gfp5 gene was constructed by PCR amplification (30 cycles of 30 sees at 94°C, 
30 sees at 55 °C and 30 sees at 72°C using VENT DNA Polymerase) of m-gfp using 
mutagenic primers. The forward primer was an oligo corresponding to nucleotides 445- 
560 of the m-gfp5 coding sequence shown in Figure 15 and the reverse primer was GFP- 
3' Sac. The amplified fragment was cleaved and exchanged with the AcchSacl fragment 
of m-gfp to create m-gfp5. 

For bacterial expression studies, BamHl-Sacl PCR fragments containing the m-gfp y m- 
gjpA and m-gfp5 genes were cloned downstream of the tac promoter of the expression 
vector pSE380 (Invitrogen), to give the plasmids pSE-GFP, pSE-GFPA and pSE-GFP5, 
respectively. Expression from the tac promoter of pSE380 is tightly regulated due to the 
presence on the plasmid of the taclq gene. For yeast expression, the same PCR 
fragments containing the m-gfp, m-gfpA and m-gfp5 genes were inserted downstream of 
the constitutive ADH1 promoter of pVT103-U (Vernet et a/., 1987), a yeast multicopy 
episomal plasmid containing the URA3 selectable marker. The resulting plasmids were 
pVT-GFP, pVT-GFPA and pVT-GFP5. respectively. 

To assess the difference in fluorescence between strains expressing modified GFP and 
GFPA quantitatively, the inventors introduced expression plasmids pSE-GFP and pSE- 
GFPA into E. coli strain XL 1 -Blue and measured the fluorescence (X iT = 397 nm r X em 
= 508 run) of equal optical densities of cells at various times following IPTG-induction 
of protein synthesis at 37°C (Fig. 7). 4.5 hrs after induction, cells expressing m-GFPA 
were observed to fluoresce approximately 20-fold more intensively than those expressing 
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m-GFP, a figure which increased to approximately 35-fold by the time the cells had 
entered stationary phase (9 hrs after induction). 

To determine whether the enhanced fluorescence of cells expressing m-GFPA might be 
due to increased levels of protein expression, total protein was prepared from cells from 
the 4.5 hr time point and the amount of intracellular GFP estimated by Western blot 
analysis. As can be seen in Fig. 8, m-GFPA accumulates to a significantly higher level 
than modified GFP. The "vector" track is a negative control. The numbers on the right 
of the blot represent the molecular weights of known standards. However, the difference 
in protein levels as estimated by quantification of band intensities, 2. 4- fold, is not nearly 
enough to account for the approximately 20-fold difference in fluorescence levels 
observed at this time point. This result suggests that a large proportion of GFP that is 
expressed in cells at 37 °C is non-fluorescent and that the substitutions present in m- 
GFPA enhance the maturation of the protein to the fluorescent form. Comparison of the 
growth curves of strains expressing m-GFP and m-GFPA with the growth curve of a non- 
expressing strain (data not shown) indicated that expression of these proteins does not 
have any adverse effects on the growth of bacterial cells. 

The amino acid substitutions present in m-GFPA suppress the temperature-sensitivity 
of GFP maturation 

Lim and co-workers (Lim et at. , cited above) have recently reported that maturation of 
GFP to the fluorescent form is sensitive to temperature during expression in the yeast 
Saccharomyces cerevisiae. To test whether the same may be true during expression in 
E. coli and whether the substitutions present in m-GFPA enhance maturation by 
suppressing any such sensitivity, the inventors examined expression of m-GFP and m- 
GFPA over a range of different temperatures. Strains containing pSE-GFP and pSE- 
GFPA were induced overnight at temperatures ranging between 25 °C and 42 °C. For 
each culture, the fluorescence of equal optical densities of cells was measured and the 
amount of intracellular GFP determined by Western blot analysis (Table 1). 
Fluorescence values were then normalised against the amount of GFP present inside cells 
so as to give a relative measure of the proportion of intracellular GFP that is fluorescent 
for each culture. The results (Fig. 9) clearly show that the proportion of modified GFP 
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that is fluorescent steadily decreases with increasing incubation temperature (open 
columns), indicating that maturation of the protein to the fluorescent form is temperature 
sensitive. In contrast, the substitutions present in m-GFPA (shaded columns) suppress 
this sensitivity to temperature, with maturation being optimal at 37°C. 

Table 1 



Temperature 

(°C) 


Fluorescence 
(arbitary units) 


Relative amount of intracellular 
GFP (units) 




m-GFP 


m-GFPA 


m-GFP 


m-GFPA 


25 


328.4 


722.2 


0.29 


0.58 


30 


100.5 


541.1 


0.21 


0.82 


37 


67.9 


2273.0 


0.23 


1.00 (7.8x10 s ) 


42 


9.2 


369.4 


0.17 


0.44 



Investigation into the thermosensitivity of GFP maturation 

The post-translational maturation of GFP to the fluorescent form involves a number of 
steps. The first step, presumably, is folding of the apoprotein into a catalytic 
conformation that facilitates the novel reactions involved in formation of the 
chromophore. These reactions consist of cyclisation and oxidation of the tripeptide 
Ser65-Tyr66-Gly67 to give a p-hydroxybenzylidene-imidazolidinone structure. Once the 
chromophore has been formed, it is then only fluorescent once GFP has adopted a fold 
which protects it from solvent effects. In principle, any of these processes could be 
sensitive to temperature and thus be responsible for the observed thermosensitivity of 
GFP maturation. 

Since the oxidation reaction involved in chromophore formation appears to require 
molecular oxygen, Heim and co-workers (Heim et aL. 1995 Nature 373, 663-664) have 
been able to measure the reaction rate by expressing GFP in £. coli under anaerobic 
conditions and then monitoring the development of fluorescence after admission of air. 
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To determine whether this reaction might be temperature sensitive and whether the 
substitutions present in m-GFPA act by enhancing its rate at higher temperatures, we 
measured the rates of oxidation of m-GFP and m-GFPA at both 25 °C and 37 °C For 
these experiments a yeast expression system was used, which provided for better growth 
and expression levels than E. coli under anaerobic conditions. Strains of Saccharomyces 
cerevisiae MGLD-4a (MATa, leu2 f ura3. his3, trpl, lys2) containing either pVT-GFP or 
pVT-GFPA were incubated anaerobically (Becton-Dickinson BBL GasPak Pouch) 
overnight at 30°C in synthetic drop-out media lacking uracil (Rose et al. , 1990 "Methods 
in Yeast Genetics. A Laboratory Course Manual", Cold Spring Harbor Laboratory 
Press, Cold Spring Harbor, USA). Following admission of air to the pouch, 1.0 ml of 
each culture was immediately centrifuged for 1 min at 13,000 rpm and resuspended in 
0.5 ml aerated and prewarmed PBS (pH 7.4) containing 8 mM NaN 3 as a metabolic 
inhibitor. Cell suspensions were placed immediately into pre-warmed cuvettes held 
within the fluorimeter carousel and the time course of fluorescence (X„ = 397 nm, \ m 
- 508 nm) development measured. 

As reported previously by Heim et aL, each oxidation proceeded as a simple first order 
reaction (Fig. 10). Figure 10 shows the rate of fluorescence development for cultures 
expressing modified GFP at 25 °C (crosses) or 37 °C (triangles), or cultures expressing 
GFPA at 25°C (squares) or 37°C (circles). 

The time constant measured for the oxidation of m-GFP at 37°C (5.9 +. 0.1 min) was 
found to be approximately 3-fold faster than that measured at 25 °C (16.2 ± 0.3 min), 
indicating that the post-translational oxidation of the GFP chromophore is not the step 
responsible for the temperature sensitivity of maturation. In confirmation of this 
conclusion, the time constants derived for m-GFPA at both 25°C and 37°C (22.5 ± 1.4 
min and 18.1 ±_ OA min, respectively) were actually slower than those measured for m- 
GFP. 

Heim and co-workers have also reported that some GFP forms non-fluorescent inclusion 
bodies during expression in E. coli. indicating that not all GFP folds properly under these 
conditions. To determine whether the proper folding of m-GFP might be temperature 
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sensitive and whether the substitutions present in m-GFPA act by enhancing proper 
folding at increased temperatures, the inventors examined the solubilities of the two 
proteins during expression in £. coli at 25 °C and 37°C. Bacterial cells expressing m- 
GFP or m-GFPA were grown overnight at either 25°C or 37°C lysed, and the soluble 
and insoluble fractions separated by centrifugation. 

Specifically, cells containing pSE-GFP or pSE-GFPA were grown in 1.5 ml of 2xTY 
broth to an absorbance of 0.2 at 600 nm and then induced overnight with 0.2 mM IPTG. 
The cultures were centrifuged at 13,000 rpm for 2 min, resuspended in 500 ii\ 50 mM 
Tris-HCl (pH 8.0), 2 mM EDTA, 100 M g/ml lysozyme, 0.1% Triton X-100 and 
incubated at 30°C for 15 min. Cells were then lysed by sonication (5 x 15 sees) using 
a Heat Systems (Model CL4) sonicator and centrifuged at 13,000 rpm for 15 min at 4°C. 
The supernatant (soluble fraction) was removed and stored at -70 °C until used. The 
pellet (insoluble fraction) was washed once with 500 /xl 50 mM Tris-HCl (pH 8.0) t 10 
mM EDTA, 0.5% Triton X-100, resolubilised for 1 hr at room temperature in 500 jil 
resolubilisation buffer (8 M urea, 0.1 M NaH 2 P0 4t lOmM Tris-HCl pH 6.3) and stored 
at -70°C until used. The amount of m-GFP or m-GFPA present in each fraction was 
then estimated by Western blot analysis (Fig. 11). 

SDS-PAGE and Western blot analysis were carried out according to normal procedure 
(Sambrook et aL, 1989 "Molecular Cloning. A Laboratory Manual". Cold Spring 
Harbor Laboratory Press, Cold Spring Harbor, USA). Primary antibodies were 
polyclonal rabbit anti-GFP (generous gift of S. Santa-Cruz) used at a dilution of 1/2,000. 
Antibodies were detected with iodinated Protein A (Amersham) and bands visualised and 
quantified using a Molecular Dynamics Phosphorimager. In Figure 11, insoluble and 
soluble fractions are denoted by the letters I and S respectively, with cultures grown at 
25°C shown on the left, and cultures grown at 37°C shown on the right. In all cases, 
fluorescence was found almost exclusively in the soluble fraction. At 25 °C. both m-GFP 
and m-GFPA were found predominantly in the soluble fraction, indicating that proper 
folding of both proteins is efficient at this temperature. At 37°C. however, the majority 
of m-GFP was found as aggregated protein in the insoluble fraction, whereas most of m- 
GFPA was still present in the soluble fraction. This result indicates that the temperature 
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sensitivity of m-GFP maturation is due primarily to improper protein folding at higher 
temperatures and that this defect is suppressed by the amino acid substitutions present in 
m-GFPA. 

To gain information on which species in the maturation pathway of GFP aggregates at 
higher temperatures, the inventors made use of the characteristic absorption of the GFP 
chromophore in either the mature (Ward & Bokman, 1982 Biochemistry 2i, 4535-4540) 
or chemically reduced state (Inouye & Tsuji 1994 FEBS Lett. 35L 211-214). If the 
aggregating species has already undergone the cyclisation reaction, GFP isolated from 
inclusion bodies should show this characteristic absorption. To facilitate the purification 
of protein for absorbance measurements, the inventors fused a polyhistidine tag to the C- 
terminus of m-GFP. 

Histidine-tagging was achieved by the addition of 6 histidine codons to the 3' ends of the 
modified gfp genes by PCR. The genes were amplified using S'Bam-GFP as the forward 
primer and the oligo 

5 - GCCQAGCTCTTAGTGGTGGTGGTGGTGGTG 
TTTGTATAGTTCATCCATGCC -3' 
(Seq ID No. 7, Sacl site underlined, histidine codons in bold) as the reverse primer. 
The amplified fragments were cleaved with BamUl and Sacl and cloned downstream of 
the tac promoter of pSE380 (Invitrogen) to give the expression plasmids pSE-GFPHis, 
pSE-GFPAHis and pSE-GFP5His respectively. 

For the purification of histidine-tagged GFP for absorbance measurements, soluble and 
insoluble fractions of cells containing pSE-GFPHis grown at 25 °C and 37 °C, 
respectively, were prepared as described previously. GFP was purified from the fractions 
on Ni-chelate columns using the Ni-NTA Spin Kit (Qiagen). Purification from the 
soluble fraction was carried out according to the protocol for the purification of histidine- 
tagged proteins under native conditions. After clearance of cellular debris from the 
insoluble fraction by centrifugation at 13.000 rpm for 30 min. purification was carried 
out according to the protocol for purification of histidine-tagged proteins under denaturing 
conditions, except that the protein was eluted with resolubilisation buffer containing 250 
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mM imidazole. 

For the purification of histidine-tagged proteins for fluorescence spectroscopy, cells were 
grown in 100 ml of 2xTY broth at 37°C to an absorbance of 0.2 at 600 nm and then 
induced overnight with 0.5 mM IPTG. Cells were harvested by centrifugation at 6,000 
rpm for 10 min and lysed by resuspension in 4 ml 20 mM Tris-HCl (pH 7.9). 500 mM 
NaCl, 5 mM imidazole, 0.1% sarkosyl, 0.1% deoxycholate. 2.25 M Guanidine-HCl. 
Nucleic acids were precipitated by the addition of 5ml isopropanol and removed by 
centrifugation at 10,000 rpm for 10 min. Fluorescent histidine-tagged proteins were 
purified from the supernatant on Ni-chelate columns (Qiagen) and eluted with 2ml of 
20mM Tris-HCl (pH 7.9), 500 mM NaCl, 150 mM imidazole. For all purifications, 
protein purity was assayed by SDS-PAGE and found to be >95%. Protein 
concentrations were determined by Bradford assay (Bio-Rad Protein Assay kit) using 
bovine serum albumin as a standard. 

Absorbance spectra were recorded on a Cary 3 UV- Visible Spectrophotometer (Varian) 
at 25 'C. The optical pathlength was 1 cm. Fluorescence spectra were recorded on a 
Hitachi F-4500 fluorimeter at 25°C using 4mm/10mm cuvettes. The bandpass for both 
the excitation and the emission monochromators was 5 nm, the scan speed 240 nm per 
min and the response time automatically adapted by the device. All spectra were 
corrected following the supplier's procedure for calibration of the fluorimeter using 
Rhodamine-B as standard. Emission spectra were recorded at a fixed wavelength of the 
excitation maximum, excitation spectra at a fixed wavelength of the emission maximum. 

Histidine-tagging of GFP did not detectably affect the temperature sensitivity of 
maturation of the protein (data not shown). The absorption spectra of equal 
concentrations of denatured protein from the two preparations were then recorded, as 
described above. The results are shown in Figure 12. which is a graph of absorbance 
against wavelength (nm). 

As can be seen in Fig. 12. denatured fluorescent protein derived from the soluble fraction 
of cells grown at 25 °C shows a characteristic absorption peak similar to that of the m- 
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GFP chromophore at acid pH (Ward & Bokman. cited above). On the other hand, 
protein purified from inclusion bodies of cells grown at 37°C shows no such absorption, 
indicating that the aggregating species has not formed a chromophore. Taken together, 
the results presented above indicate that the temperature sensitivity of m-GFP maturation 
is due primarily to the failure of the unmodified apoprotein to fold into its catalytically 
active conformation at higher temperatures. Furthermore, the amino acid substitutions 
present in m-GFPA suppress this defect by enhancing proper folding at elevated 
temperatures. 

If thermosensitivity of m-GFP maturation observed in the yeast Saccharomyces cerevisiae 
is also a result of the thermosensitivity of apoprotein folding, it should be suppressed by 
the substitutions present in m-GFPA. To test this prediction, the inventors incubated 
strains of cerevisiae containing either pVT-GFP or pVT-GFPA on agar plates at either 
25°C or 37°C. As can be seen in Fig. 13, the substitutions present in m-GFPA also 
suppress the thermosensitivity of m-GFP expression in yeast. This result indicates that 
the temperature-dependent mis-folding of the m-GFP apoprotein is not simply an artefact 
of an £. coli overexpression system, but is also the basis for the thermosensitivity of m- 
GFP maturation in a heterologous eukaryotic system. 

Modification of the fluorescence spectra of m-GFPA 

Fluorescence spectroscopy of purified histidine-tagged m-GFP and m-GFPA revealed that 
the fluorescence spectra of m-GFPA are essentially unchanged from those of m-GFP 
except for a decrease in the amplitude of the 475 nm excitation peak relative to the 
amplitude of the 400 nm excitation peak (Fig. 14). Although this spectral change is 
advantageous for applications which utilise 400 nm excitation, it is also detrimental for 
those which utilise 475 nm excitation. For many experiments, the ideal spectral variant 
would be a protein which could be efficiently excited at either of these wavelengths. This 
characteristic would afford greater flexibility with regard to the range of applications in 
which the protein could be used. 

Recently, it has been demonstrated that, as observed here, the relative amplitudes of the 
excitation peaks of GFP can be altered by means of mutagenesis (Ehrig et aL. 1995 
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FEBS Len. 367, 163-166; Delagrave et al., 1995 Bio/Technology 13, 151-154). A 
number of these mutations, like the substitutions present in m-GFPA, are located in the 
C-terminal region of the protein. It has been hypothesised that, in the three-dimensional 
structure of GFP, the C-terminal region is close to the chromophore and that mutations 
in this region can affect the microenvironmem of the chromophore so as to influence the 
equilibrium between the two tautometric forms of the chromophore that are responsible 
for the two excitation peaks (Heim et al., 1994 & Ehrig et al., 1995). One of these 
mutations. I167T, inverts the ratio of the 400 nm to 475 ran excitation peak heights. If 
the effects of mutations in the C-terminal region of GFP on the spectroscopic state of the 
chromophore are additive, then it is possible that combination of the I167T substitution 
with the substitutions present in GFPA might increase the amplitude of the 475 ran peak 
relative to the 400 nm peak. 

Histidine-tagged m-GFP5 was purified and its excitation and emission spectra analysed 
by fluorescence spectroscopy. As can be seen in Fig. 14, m-GFP5 has two excitation 
peaks (maxima at 395 nm and 473 nm) of almost exactly equal amplitude and an emission 
spectrum largely unchanged from that of m-GFP. To determine whether m-GFP5 has 
retained the thermotolerant phenotype of GFPA, bacterial cells containing pSE-GFP or 
an expression plasmid containing m-gfi>5 (pSE-GFP5) were induced with IPTG for 5 
hours at 37°C. The fluorescence (X„ - 395 nm or 473 nm, \ m = 507 nm) of equal 
optical densities of cells was then measured. Cells expressing m-GFP5 were observed 
to fluoresce 39-fold more intensely than cells expressing m-GFP when excited at 395 nm 
and 1 1 1-fold more intensely when excited at 473 nm. These results indicate that m-GFP5 
has not only retained the thermotolerant phenotype of m-GFPA. but has improved upon 
it. 



Further modification of mgfp5 was achieved. Two synthetic oligonucleotides were made, 
to act as mutagenic PCR primers to add an in-frame £coRI site at the 5' end of the gene 
and to add a sequence coding for the amino acid tag HDEL at the C terminal of the 
protein (which tag acts as an endoplasmic reticulum localisation signal). 

The PCR mutagenised sequence was then used in a three-way ligation reaction with 
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BamRMSacl - cut vector and a pair of synthetic oligonucleotides with BamHI/EcoW ends. 
The synthetic oligos had the sequences: 

5' GGC GGA TCC AAG GAG ATA TAA CAA TGA AGA CTA 
ATC TTT TTC TCT TTC TCA TCT TTT CAC 3' (Seq ID No. 8) and 

5' GCC GAA TTC GGC CGA GGA TAA TGA TAG 
GAG AAG TGA AAA GAT GAG AAA GA 3' (Seq ID No. 9) 

The oligos were annealed, extended with Klenow polymerase and cut with BamHVEcoKL. 
When ligated with the m-gfp5HDEL gene, they introduced the signal sequence from 
Arabidopsis chitinase at the 5' end of the coding sequence. The nucleotide sequence of 
the resulting modified gene {m-gfp5-ER), and the amino acid sequence of its polypeptide 
product (Seq ID No.s 10 and 11 respectively), are shown in Figure 16. The nucleotides 
encoding the signal sequence are shown in upper case letters, whiolst the rest of the 
sequence is in lower case letters. The C terminal HDEL tag on the protein is apparent. 

The modified gene, when expressed in Arabidopsis, gave highly efficient concentration 
of GFP-mediated fluorescence in the endoplasmic reticulum (Figure 17). Referring to 
Figure 17, the panels illustrate confocal micrographs of 5-day old A. thaliana seedlings 
expressing m-GFP (panels A-D) or m-GFP5-ER (panels E-H), imaged at 395nm 
excitation wavelength. Panels A & E are sections of the junction between the hypocotyl 
and the cotyledon (bar = 25/xM); panels B & F show hypocotyl epidermal cells (bar = 
IOjiM); panels C & G show median longitudinal sections of root tips (bar - 25ptM); and 
panels D & H show roots, with nucleoplasms accumulation of mGFP (in D) and 
retention in the endoplasmic reticulum of mGFP5-ER (in H), (bar = IOjiM). 

DISCUSSION 

GFP expression in plants 

The objective of this work was to begin the development of gfp for use as a genetic 
marker in transformation and as a reporter for localised gene expression in Arabidopsis 
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and other plants. In order to successfully employ the gfp cDNA in plants, three major 
steps need to be addressed. 

(1) The GFP apoprotein must be produced in suitable amounts within the plant cells. 

(2) The apoprotein must undergo efficient post-translational cyclisation and oxidation to 
produce the mature GFP. 

(3) The fluorescent protein may need to be suitably targeted within the cell, to allow 
efficient post-translational processing, safe accumulation to high levels, or to allow easier 
distinction of expressing cells. 

The inventors have shown that expression of the jellyfish gfp cDNA in Arabidopsis is 
curtailed by aberrant splicing, with an 84 nucleotide intron being efficiently excised from 
within the GFP coding sequence. The recognition of introns in plant pre-mRNAs 
primarily requires conserved sequences found adjacent to the 5' and 3' splice sites, which 
are related to those found in other eukaryotes. and, arypically, a high A:U content within 
the intron. The inventors altered potential recognition sequences at the 5' splice site, and 
decreased the A:U content of the cryptic intron by in vitro mutagenesis to produce a 
modified m-gfp gene which was successfully expressed in transgenic Arabidopsis plants. 
It is likely that this m-gfp gene will be useful for expression studies in other plants, which 
appear to share similar features involved in intron recognition. 

It is also possible that aberrant splicing may interfere with GFP expression in other 
organisms. However, introns found in yeast possess a requirement for conserved 
sequences located at the branch point, and introns found in animal cells (including 
jellyfish) share a conserved polypyrimidine tract adjacent to the 3' splice site. The lack 
of these additional features may allow correct processing of the gfp mRNA in fungal and 
animal cells. 

With expression of the m-gfp gene in Arabidopsis, it has now been shown that the 
apoGFP readily undergoes maturation, and that the fluorescent form of the protein 
accumulates in transformed cells. Transformed cells were often intensely fluorescent, and 
were easily detectable by eye using a long-wave UV lamp. However it proved difficult 
to efficiently regenerate fertile plants from the brightest transformants. with cells 
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remaining as a highly fluorescent callus or mass of shoots after several months of culture. 
It is possible that high levels of GFP expression were mildly toxic or interfered with 
differentiation, due perhaps to the fluorescent or autocatalytic properties of the protein. 
In the natural situation, in jellyfish photocytes where high levels of GFP are well 
tolerated, the protein is found sequestered in microbody-like lumisomes. In contrast, the 
mature protein is found throughout the cytoplasm and nucleoplasm in transformed 
Arabidopsis. If GFP is a source of fluorescence-related free radicals, for example, it 
might be advisable to target the protein to a more localised compartment within the plant 
cell. Appropriate localisation signals are known to those skillled in the an and it should 
prove possible to incorporate these into the GFP polypeptide without unduly disrupting 
the fluorescence characteristics of the protein. 

The inventors have adapted the green fluorescent protein (GFP) of Aequoria victoria for 
use as a genetic marker in Arabidopsis thaliana. Transcripts of the jellyfish GFP coding 
sequence are mis-spliced in Arabidopsis, with an 84 nucleotide intron being efficiently 
excised. A modified version of the gfp sequence has been constructed to destroy this 
cryptic intron, and to restore proper expression of the protein in plant cells. GFP is 
mainly localised within the nucleoplasm and cytoplasm within transformed Arabidopsis 
cells, and its presence allows optical sectioning of intact plants using confocal laser 
scanning microscopy. The modified gfp sequence may be useful for directly monitoring 
gene expression and protein localization at high resolution, and as a simply scored genetic 
marker in living plants. 

A major use for m-gfp would be as a replacement for the ^-glucuronidase gene, used as 
a reporter for promoter and gene fusions in transformed plants. Histochemical staining 
is used to identify cells expressing the GUS gene product, but a fluorescent product can 
be imaged directly and rapidly. Gene expression and protein localization can be observed 
in physiologically active cells without a prolonged and lethal staining procedure, and 
fluorescence microscopy techniques allow the high resolution imaging of GFP-expressing 
cells. In addition, it becomes feasible to follow dynamic events in living cells and 
tissues. 
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High levels of fluorescence intensity are obtained in GFP-transformed bacterial and yeast 
colonies allowing simple screening for GFP expression with the use of a hand-held UV 
lamp. Such an assay for gene expression in living plants would be a very useful tool for 
plant transformation experiments. Many transformation techniques give rise to 
regenerating tissues which are variable or chimeric, and require testing of the progeny 
of the primary transformants. Potentially, m-g^-transformed tissues could be monitored 
using in vivo fluorescence, avoiding any need for destructive testing, and the appropriate 
transformants could be rescued and directly grown to seed. Similarly, in vivo 
fluorescence would be an easily scored marker for field testing in plant breeding, 
allowing m-g#?-linked transgenes to be easily followed. 

Use of a confocal laser scanning microscope will allow the clear analysis of plant tissue 
whole-mounts despite the refractile nature and light scattering (and for some cells, 
autofluorescent) properties of plant cell walls. 



In this study, the inventors have also shown that maturation of GFP in E. coli is sensitive 
to temperature, due primarily to the mis-folding of the apoprotein into inclusion bodies 
at elevated temperatures. They have also described two mutants, m-GFPA and m-GFP5, 
whose folding is thermotolerant. Presumably, the charateristic of the GFP apoprotein 
that causes it to aggregate at higher temperatures and the mechanism by which the 
mutations present in m-GFPA and m-GFP5 suppress this effect is unknown. However, 
studies on the effects of mutations on the tendency of some other proteins to aggregate 
(Thomas et «/., 1995 Trends Biochem. Sci. 20, 456-459; Mitraki et al., 1991 Science 
253, 54-58; Wetzel 1994 Trends Biotech. 12, 193-198; and Chrunyk etal., 1993 J. Biol. 
Chem. 265, 18053-18061) suggest a number of possibilities. 

The simplest explanation is that the native apoprotein or one of its folding intermediates 
is thermodynamically unstable and the protein aggregates when in the unfolded state. 
The substitutions present in the thermotolerant mutants could suppress the characteristic 
either by increasing the thermodynamic stability of the unstable species or by decreasing 
its steady state level by increasing the rate of chromophore cyclisation. Alternatively, 
higher temperatures can allow proteins to overcome the thermodynamic barriers to the 
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formation of off-pathway folding intermediates which may become kinetically trapped by 
aggregation. It is possible, therefore, that the substitutions present in the heat-tolerant 
mutants act by suppressing such a phenomenon by directing folding along the correct 
pathway at elevated temperatures. It is also possible that the kinetic half life of an 
aggregation-prone intermediate in the normal apoprotein folding pathway is significantly 
increased at higher temperatures. Mutations could suppress this characteristic either by 
decreasing the half life of such an intermediate or by reducing its tendency to aggregate. 
Finally, the suppressor mutations may favour proper folding at higher temperatures by 
increasing the affinity of the apoprotein for a molecular chaperone. 

To differentiate between these different possibilities, biophysical analyses of variants of 
GFP and the heat tolerant mutants that cannot undergo cyclisation and are thus trapped 
as apoproteins will be required. However, the observation that the substitutions present 
in m-GFP A increase the T m of mature GFP by 4.0°C (data not shown) provides 
preliminary evidence that they may act by increasing the thermodynamic stability of the 
native apoprotein. As well as enhancing proper folding, the substitutions present in m- 
GFPA contribute to the bright phenotype of the mutant protein by facilitating its 
accumulation to higher levels than m-GFP (Table 1). This observation indicates that GFP 
is turned over more rapidly than m-GFPA, probably because partially or mis-folded m- 
GFP apoprotein that does not aggregate would be degraded by the cellular proteolytic 
machinery. 

The inventors have shown that oxidation of the GFP chromophore does not contribute to 
the temperature sensitivity of maturation by measuring the reaction rate in yeast cells at 
both 25°C and 37°C (Fig. 3). An interesting point arising from this experiment is that 
the time constants derived for m-GFP at both 25°C and 37°C (5.9 ± 0.1 min and 16.2 
±_ 0.3 min, respectively) are significantly faster than the 120 min estimated for the 
oxidation of GFP in bacteria by Heim et al. This observation may reflect a difference 
in the physiological states of yeast and bacterial cells following anaerobic growth or 
perhaps the presence of a catalysing factor in yeast cells. 

Nevertheless, these results suggest that the oxidation of the GFP chromophore has the 
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capacity to proceed at a much higher rate than previously thought. Therefore, in some 
cases, the factor which limits how quickly fluorescent can be observed following protein 
synthesis may be the efficiency with which the apoprotein folds rather than the time taken 
for oxidation of the chromophore. 

Examination of the fluorescence spectra of the m-GFPA revealed a decrease in the 
amplitude of the 475nm excitation peak relative to the amplitude of the 400nm excitation 
peak. This result indicates that mutations in the C-terminal region of GFP are able to 
modulate the spectroscopic state of the chromophore by affecting its local environment 
within the protein. The inventors have utilised this phenomenon to engineer the 
fluorescence spectra of m-GFP5 by introducing a third substitution, I167T, into the C- 
terminal region of m-GFPA. m-GFP5 has two excitation peaks (maxima at 395nm and 
473nm) of almost exactly equal amplitude and is thus ideal as a multi-purpose spectral 
variant which can be used for applications requiring both UV and blue excitation. Since 
the substitutions present in m-GFPA and m-GFP5 affect the environment of the 
chromophore, it is likely that they also influence the intrinsic brightness of the mutant 
proteins by affecting the extinction coefficients and/or quantum yields of the chromophore 
at the two excitation wavelengths. However, to measure an extinction coefficient 
accurately, one must be certain that every GFP molecule in a given sample is mature. 
The results presented here suggest that, even in a soluble fraction, there may be 
appreciable amounts of mis-folded or non-fluorescent apoprotein. In support of this 
notion, the ratio of the absorbance of the chromophore to that of the aromatic amino 
acids of histidine-tagged m-GFP purified from the soluble fraction of bacterial cells 
grown at either 25°C (Fig. X+4) or 37°C (Inouye & Tsuji, cited above) is 
approximately 0.4. Since this value is in excess of 1 .0 for either native or acid-denatured 
GFP isolated directly from the Aequorea jellyfish, it would appear that more than half 
of the recombinant GFP in a soluble fraction does not have a chromophore. 

These observations suggest that extinction coefficients and quantum yields may be 
difficult to measure unambiguously for recombinant forms of GFP. Therefore, great care 
must be taken when interpreting the effects of mutations that alter the brightness of GFP. 
For example, a number of mutations in and near the chromophore of GFP have recently 
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been described that cause significant shifts in the excitation and/or emission spectra of 
the protein. A subset of these mutations that alter the tyrosine residue at position 66 to 
tryptophan, histidine or phenylalanine progressively blue-shift the excitation and emission 
spectra. However, these mutant proteins are much less fluorescent than GFP, a 
phenomenon which has been attributed to them having sub-optimal extinction coefficients 
and/or quantum yields due to the poor fit of the alternative amino acids into the central 
cavity normally occupied by the tyrosine residue. It is possible, however, that the 
observed low fluorescence of these mutants is due to detrimental effects of the 
substitutions on folding and/or chromophore formation, resulting in the presence of large 
amounts of non-fluorescent protein in soluble fractions. Therefore, it is feasible that the 
proper maturation of these mutants might be enhanced by the introduction of the amino 
acid substitutions present in m-GFPA or m-GFP5. Indeed, expression of a protein 
containing the Y66H mutation in combination with the substitutions present in m-GFPA 
in £. coli at 37°C resulted in a 29-fold increase in fluorescence. The fluorescence 
spectra of this hybrid protein were also unchanged from those of the Y66H mutant alone 
(data not shown). Therefore, it is foreseeable that the substitutions present in m-GFPA 
and m-GFP5 may be combined with these and other pre-existing spectral mutations in the 
chromophore of GFP to produce a range of spectral variants with greatly improved 
maturation characteristics. 

As well as in £. coli, maturation of m-GFP appears to be thermosensitive in the yeast 
Saccharomyces cerevisiae and in mammalian cells. Therefore, it appears that the 
sensitivity of apoprotein folding to temperature may be a ubiquitous phenomenon. 
Indeed, it is interesting to note that the brightness of m-GFP in Arabidopsis thaliana is 
markedly increased by its retention in the endoplamic reticulum (see accompanying 
paper), where a high concentration of chaperonins may enhance proper folding. It is 
unlikely, however, that the folding defect of m-GFP would manifest itself in the same 
way in systems where lower expression levels mean that aggregation may not occur to 
the same extent as in an E. coli overexpression system. Rather, it is more likely that 
partially or mis-folded apoprotein would, if it did not aggregate heavily, become a target 
of the cellular proteolytic machinery. Therefore, rather than becoming kinetically trapped 
by aggregation, improperly folded apoprotein would be depleted by degradation. In 
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support of this notion, accumulation in yeast of a GFP-nucleoplasmin fusion protein 
expressed from two gene copies steadily decreases with increasing incubation 
temperature. 

Moreover, if the sensitivity of m-GFP apoprotein folding to temperature is a ubiquitous 
phenomenon, then use of the thermotolerant mutants described here should result in 
improved expression in a wide range of experimental systems. Indeed, in this work the 
inventors have demonstrated that the substitutions present in m-GFPA are capable of 
suppressing the thermosensitivity of m-GFP expression in the yeast Saccharomyces 
cerevisiae. Expression of m-GFPA has also been observed to give rise to significantly 
increased fluorescence xnDrosophila melanogaster embryos incubated at 25 °C (A Brand, 
personal communication) and expression of rn-GFP5 fused to endoplasmic reticulum 
retention signals has been observed to result in high levels of fluorescence in Arabidopsis 
thaliana (data not shown). Most strikingly, expression of both m-GFPA and m-GFP5 
has been found to result in greatly increased levels of fluorescence in mammalian cells. 
Therefore, we anticipate that the thermotolerant mutants described in this work and 
spectral variants derived from them will be of great benefit for expression in many 
experimental systems, particularly those such as mammalian cells that utilise higher 
incubation temperatures. 
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SEQUENCE LISTING 



(1) GENERAL INFORMATION: 

(l) APPLICANT: 

(A) NAME: Medical Research Council 

(B) STREET: 20 Park Crescent 

(C) CITY: London 

(E) COUNTRY: United Kingdom 

(F) POSTAL CODE (ZIP): WIN 4AL 

(G) TELEPHONE: (0171) 636 5422 

(H) TELEFAX: (0171) 323 1331 

(ii) TITLE OF INVENTION: Improvements in or Relating to Gene 
Expression 

(iii) NUMBER OF SEQUENCES: 11 

(iv) COMPUTER READABLE FORM: 

(A) MEDIUM TYPE: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) OPERATING SYSTEM: PC -DOS /MS -DOS 

(0) SOFTWARE: Patentln Release #1.0. Version #1.30 (EPO) 



(2) INFORMATION FOR SEQ ID NO: 1: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 50 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1: 
GGCGGATCCA AGGAGATATA ACAATGAGTA AAGGAGAAGA ACTTTTCACT 50 



(2) INFORMATION FOR SEQ ID NO: 2: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 33 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 
CD) TOPOLOGY: linear 



(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2: 
GGCGAGCTCT TATTTGTATA GTTCATCCAT GCC 
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(2) INFORMATION FOR SEQ ID NO: 3: 

(i) SEQUENCE CHARACTERISTICS- 

(A) LENGTH: 122 base pairs 

(B) TYPE: nucleic acid 

(C) STRANOEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3: 
GATCATATGA AGCGGCACGA CTTCTTCAAG AGCGCCATGC CTGAGGGATA CGTGCAGGAG 60 
AGGACCATCT TCTTCAAGGA CGACGGGAAC TACAAGACAC GTGCTGAAGT CAAGTTTGAG 120 
GG 

122 

(2) INFORMATION FOR SEQ ID NO: 4: 

(i) SEQUENCE CHARACTERISTICS- 

(A) LENGTH: 126 base pairs 

(B) TYPE: nucleic acid 

(C) STRANOEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: 

GATGTATACG TTGTGGGAGT TGTAGTTGTA TTCCAACTTG TGGCCGAGGA TGTTTCCGTC 60 

CTCCTTGAAA TCGATTCCCT TAAGCTCGAT CCTGTTGACG AGGGTGTCTC CCTCAAACTT 120 

^ 126 

(2) INFORMATION FOR SEQ ID NO: 5: 

(i) SEQUENCE CHARACTERISTICS- 

(A) LENGTH: 50 base pairs 

(B) .TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: 
GGCGGATCCA AGGAGATATA ACAATGAGTA AAGGAGAAGA ACTTTTCACT 50 

(2) INFORMATION FOR SEQ ID NO: 6: 

(i) SEQUENCE CHARACTERISTICS 

(A) LENGTH: 33 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 
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(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6: 
GGCGAGCTCT TATTTGTATA GTTCATCCAT GCC 33 



(2) INFORMATION FOR SEQ ID NO: 7: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 51 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7: 
GCCGAGCTCT TAGTGGTGGT GGTGGTGGTG TTTGTATAGT TCATCCATGC C 51 



(2) INFORMATION FOR SEQ ID NO: 8: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 60 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: Single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8: 
GGCGGATCCA AGGAGATATA ACAATGAAGA CTAATCTTTT TCTCTTTCTC ATCTTTTCAC 60 



(2) INFORMATION FOR SEQ ID NO: 9: 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 50 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9: 
GCCGAATTCG GCCGAGGATA ATGATAGGAG AAGTGAAAAG ATGAGAAAGA 50 



(2) INFORMATION FOR SEQ ID NO: 10: 

(i) SEQUENCE CHARACTERISTICS. 

(A) LENGTH: 792 base pairs 

(B) TYPE: nucleic acid 

(C) STRANDEDNESS: single 

(D) TOPOLOGY: linear 

(ix) FEATURE: 

(A) NAME/KEY: CDS 
(Bi LOCATION:!. .789 
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ixi) SEQUENCE DESCRIPTION: SEQ ID NO: 10: 

ATG AAG ACT AAT CTT TTT CTC TTT CTC ATC TTT TCA CTT CTC CTA TCA 
Met Lys Thr Asn Leu Phe Leu Phe Leu He Phe Ser Leu Leu Leu Ser 
15 10 15 

TTA TCC TCG GCC GAA TTC AGT AAA GGA GAA GAA CTT TTC ACT GGA GTT 
Leu Ser Ser Ala Glu Phe Ser Lys Gly Glu Glu Leu Phe Thr Gly Val 
20 25 30 

GTC CCA ATT CTT GTT GAA TTA GAT GGT GAT GTT AAT GGG CAC AAA TTT 144 
Val Pro lie Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe 
oo 40 45 

E SI? ri A r? G £? T ^ GAT GCA ACA TAC GGA AAA CTT ACC 192 
ier Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr 

50 55 60 

CTT AAA TTT ATT TGC ACT ACT GGA AAA CTA CCT GTT CCA TGG CCA ACA 
Leu Lys Phe lie Cys Thr Thr Gly Lys Leu Pro vil Pro Trp Pro Thf 
60 70 75 80 

CTT GTC ACT ACT TTC TCT TAT GGT GTT CAA TGC TTT TCA AGA TAC CCA 
Leu Val Thr Thr Phe Ser Tyr Gly Val Gin Cys Phe Ser Arg Tyr Pro 
85 go 95 

GAT CAT ATG AAG CGG CAC GAC TTC TTC AAG AGC GCC ATG CCT GAG GGA 336 
Asp His Met Lys Arg H 1S Asp Phe Phe Lys Ser Ala Met Pro Glu Gly 
100 105 no 

IJS SI? r AG ^ G AGG ACC A T C H C F C MG GAC GGG AAC TAC AAG 384 
Tyr Val Gin Glu Arg Thr He Phe Phe Lys Asp Asp Gly Asn Tyr Lys 

120 125 

i^t 2J S 1 P? f* 6 IT S AG SS* GAC ACC CTC GTC AAC AGG ATC 432 
Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg He 
130 135 140 

GAG CTT AAG GGA ATC GAT TTC AAG GAG GAC GGA AAC ATC CTC GGC CAC 480 
Glu Leu Lys Gly He Asp Phe Lys Glu Asp Gly Asn He Leu Gly His 
145 150 155 160 

AAG TTG GAA TAC AAC TAC AAC TCC CAC AAC GTA TAC ATC ATG GCC GAC 528 
Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr He Met Ala Asd 
165 170 175 

AAG CAG AAG AAC GGC ATC AAA GCC AAC TTC AAG ACC CGC CAC AAC ATC 576 
l;/s Gin Lys Asn Gly He Lys Ala Asn Phe Lys Thr Arg His Asn He 
180 185 190 

GAA GAC GGC GGC GTG CAA CTC GCT GAC CAT TAT CAA CAA. AAT ACT CCA 624 
uiu Asd Gly Gly val Gin Leu Ala Asp His Tyr Gin Gin Asn Thr Pro 
195 200 205 
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ATT GGC GAT GGC CCT GTC CTT TTA CCA GAC AAC CAT TAC CTG TCC ACA 672 
He Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr 
210 215 220 

CAA TCT GCC CTT TCG AAA GAT CCC AAC GAA AAG AGA GAC CAC ATG GTC 720 
Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val 
225 230 235 240 

CTT CTT GAG TTT GTA ACA GCT GCT GGG ATT ACA CAT GGC ATG GAT GAA 768 
Leu Leu Glu Phe Val Thr Ala Ala Gly He Thr His Gly Met Asp Glu 
245 250 255 

CTA TAC AAA CAC GAC GAA CTC TAA 792 
Leu Tyr Lys His Asp Glu Leu 
260 



(2) INFORMATION FOR SEQ ID NO: 11; 

(i) SEQUENCE CHARACTERISTICS: 

(A) LENGTH: 263 amino acids 

(B) TYPE: amino acid 
(D) TOPOLOGY: linear 

(ii) MOLECULE TYPE: protein 

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11: 

Met Lys Thr Asn Leu Phe Leu Phe Leu He Phe Ser Leu Leu Leu Ser 
15 10 15 

Leu Ser Ser Ala Glu Phe Ser Lys Gly Glu Glu Leu Phe Thr Gly Val 
20 25 30 

Val Pro He Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe 
35 40 45 

Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr 
50 55 60 

Leu Lys Phe lie Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr 
65 70 75 80 

Leu Val Thr Thr Phe Ser Tyr Gly Val Gin Cys Phe Ser Arg Tyr Pro 
85 90 95 

Asd His Met Lvs Ara His Asd Phe Phe Lys Ser Ala Met Pro Glu Gly 
100 105 110 

Tvr Val Gin Glu Arg Thr He Phe Phe Lys Asp Asp Gly Asn Tyr Lys 
115 120 125 

Thr Ara Ala Glu Val Lys Phe Glu Gly Asd Thr Leu Val Asn Ara He 
130 135 140 

Glu Leu Lvs Gl/ He Asd Phe Lys Glu Asd Glv Asn He Leu Gly His 
145 150 155 160 
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Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr He Met Ala Asp 
165 170 175 

Lys Gin Lys Asn Gly He Lys Ala Asn Phe Lys Thr Arg His Asn He 
180 185 190 

Glu Asp Gly Gly Val Gin Leu Ala Asp His Tyr Gin Gin Asn Thr Pro 
195 200 205 

He Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr 
210 215 220 

Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val 
225 230 235 240 

Leu Leu Glu Phe Val Thr Ala Ala Gly lie Thr His Gly Met Asp Glu 
245 250 255 

Leu Tyr Lys His Asp Glu Leu 
260 
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Claims 

1. A DNA sequence encoding Green Fluorescent Protein (GFP), the sequence being 
modified relative to the wild type sequence so as to allow for more efficient 
expression in a plant cell of a functional GFP polypeptide. 

2. A DNA sequence according to claim 1, wherein the modification is such as to 
reduce the probability of an RNA sequence transcribed therefrom being subject to 
erroneous splicing in a plant cell. 

3. A DNA sequence according to claim 2, comprising a plurality of nucleotide 
substitutions relative to the wild type sequence, the substitutions serving to reduce the 
excision from the transcribed RNA of the portion corresponding to nucleotides 400- 
483 of the DNA sequence. 

4. A DNA sequence according to claim 2 or 3, wherein the modification serves to 
decrease the A/U content of the transcribed RNA. 

5. A DNA sequence according to any one of claims 2, 3 or 4, wherein the 
modification serves to decrease the A/U content of the portion of the transcribed RNA 
corresponding to nucleotides 400-483 of the DNA sequence. 

6. A DNA sequence according to any one of the preceding claims, modified so as to 
cause an amino acid substitution at residue 163 and/or residue 175 relative to the wild 
type protein sequence. 

7. A DNA sequence according to any one of claims 1-6. further comprising a 
cellular localisation signal directing the encoded GFP to a particular cellular 
compartment. 

8. A DNA sequence according to claim 7. wherein the encoded GFP is directed to 
the endoplasmic reticulum (ER). 
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9. A DNA sequence according to claim 8, comprising the Arabidopsis thaliana basic 
chitinase localisation signal. 

10. An RNA sequence capable of being transcribed from a DNA sequence according 
to any one of claims 1-9. 

11. A modified GFP polypeptide comprising an amino acid substitution, relative to 
the wild type protein sequence, at residue 163 and/or 175. 

12. A modified GFP according to claim 11, wherein residue 163 is alanine or a 
related amino acid. 

13. A modified GFP according to claim 11 or 12, wherein residue 175 is glycine or a 
related amino acid. 

14. A modified GFP according to any one of claims 11, 12 or 13, comprising one or 
more further amino acid substitutions relative to the wild type protein sequence. 

15. A modified GFP according to any one of claims 11-14, comprising one or more 
further amino acid substitutions in, or immediately adjacent to, residues 65-67. 

16. A modified GFP according to any one of claims 11-15, comprising a localisation 
signal. 

17. A modified GFP according to claim 16, comprising a signal directing the GFP to 
the endoplasmic reticulum. 

18. A modified GFP according to claim 17, comprising the Arabidopsis thaliana 
basic chitinase localisation signal. 



19. A nucleic acid sequence encoding a polypeptide according to any one of claims 
11-19. 
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20. A nucleic acid construct comprising a vacleic acid in accordacne with any one of 
claims 1-9 or claim 19. 

21. An expression vector according to claim 20. 

22. A construct according to claim 20 or 21, wherein the sequence encoding GFP is 
linked in frame to a sequence of interest. 

23. A method of detecting the expression in a host cell of a sequence of interest, 
comprising causing the sequence of interest to be operably linked in frame with a 
nucleic acid sequence according to any one of claims 1-9 or claim 19, in a nucleic 
acid construct according to claim 20, introducing the construct into the host cell, and 
monitoring for fluorescence characterstic of the modified GFP. 

24. A method of screening a plurality of host cells for those which have taken up a 
nucleic acid sequence of interest, comprising mixing a construct according to claim 20 
comprising the sequence of interest with the host cells in suitable conditions, 
maintaining the host cells under appropriate conditions for a sufficient length of time 
so as to allow expression of modified GFP, and detecting those cells which exhibit 
modified GFP-mediated fluorescence. 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 




CO 
CO 
CM 



CM 

N 



z 

QQ 



0) 

o 
c 

Q) 

C7 
d> 

0) 

c 

• am 

"D 

O 
O 

CL 
U. 
O 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB 96/0 0481 



A C 



V21 
G T 



5' 



A 

G 
A 

: A 

~ C 
G 
A 

wmmm G 

A 
A 
A 
A 

G 
A 
C 
A 
A 
A 
C 
A 
A 

; a 

A 

G 
A 

*.w..'- tr> u 3' 



Fig 3A 



5' splice site 



3' splice site 

} 84 base intron | 

... AG GUAUUGA . . . UCAUGGCAG AC . . . 

GFP sequence 



5' splice site 3' splice site 

| A:U rich intron J 
. . .AG GUAAGU AG G 

plant consensus 

Fig. 3B 

SUBSTITUTE SHEET (RULE 26) 



WO 96/2*7. 



PCT/GB96/00481 



''21 



C7> 01 

0) 0) 

0 o 

to 10 

(0 (0 ^ 

01 <5> 

_ M m, 

AJ AJ 

(0 (0 
0) Q 

to co 

o u 

o o ^ 

u o 

CO (0 

AJ AJ >« 

(0 (0 

0» 0) 

10 (0 Pi 

tO (0 

^ ^ U V) 

H ^) J 

w *J 

CN w W CLi 

0 o 

01 O) 

♦J AJ O 

a) (0 

(0 tO 

O U 01 



AJ 
AJ 



Oi 0> > 



a» o> 

0) 0) o 

^ AJ 

-J iJ >H 



CO 



♦J AJ 

O U 

-J u 

O U 

•J AJ 

-J AJ 

AJ AJ 

o o 

<0 tO 



-J aj 

^ O O 

O J J 

fN OJ O) > 



CJ 
AJ 

aj 

AJ 
AJ 
AJ 

*0 
aj 
CO 

4J 
U 

I 

to 
to 

(0 
01 

0) 

to 

U 

CO 
4J 
0) 

H (0 
<7\ AJ 

T-t AJ 

cn cn 
(0 

to 
0> 



o 

4J 
AJ 

u 

AJ 
4J 

CO 
10 



(0 



& w 

0) 
0) 

(0 nt 
0 

B 



S w 



AJ 

01 
(0 

0> 
(0 
(0 



8« 

o u ^ 

to (0 s 

o o 

0» 0» < 



8. 

to co 

0) 
(0 
(0 



U 0 

AJ AJ 

AJ ±J 

iJ iJ 

AJ AJ 

o o 

M (0 (0 

oo 0» 0) Q 

H U O 

(0 (0 



aj 
AJ 
0 

0 
0 
(0 



9 



4J 

& 

Ol 



O 
4J 

o 

AJ 

o 

0 

o 

(0 



0> e> 



(0 
(0 

o» b) w 

aj aj 
*j 

AJ ^ In 

o> 0) 

(0 CO 

<0 (0 K 

rt U iJ 

H (0 (0 

m to (0 

m 0> Oi W 

aJ aj 

0» Oi < 

o 0 ft 

to to 

0 o 

10 <0 Eh 

0> cn 

(0 (0 

(0 (0 ^ 

2 u 

CO (0 

AJ U X 

u o 

tO (0 

(0 (0 s 

0* cn 

01 Ol 

o> t?> a 

CO nj 

o> o) a 

H 4J g 

O (d (0 

h D) OiQ 

H (0 & 

(N (0 (0 

ro to (0 





(0 




to 








u 




to 




f \ 
w 




to 




0 




H 

w 




4J 




AJ 




ri 
w 




4J 




4J 




(0 




U 




to 




to 




to 




0 




u 








to 




0 




to 


m 


(0 




0 






r-i 


<0 




to 


^ 


to 




4J 




AJ 




JJ 




4J 




CO 




0 




AJ 




A-> 




iO 




AJ 




0 




w 




to 




(0 




to 




CO 




AJ 




AJ 




0 




(0 




0 




0 




AJ 




to 


rH 


to 


CN 


0 


tH 


to 


\ 




rH 


AJ 


QO 


(0 


m 


to 



(0 K 

(0 

o 

(0 K 

o 



H 



u 

tO *y 

(0 s 

to 

Bo 

0 

AJ 

So 
o 

1o H 



(0 

JJ 

AJ 

to 
o 

AJ 

(0 H 



Cn 

to ct 
u 

(0 

to 2 



(0 (0 

& & « 

0) cn O 

AJ U 

(0 (0 

to to 2 

0> 0) 

fO co 

CO (0 ^ 



(0 
(0 

o 



(0 CO 

iO (0 

to to * 

0 o 

£2, to _ 

01 » Q 



0 

AJ 



m aj 

C^ : «0 



8 



<0 



H fO 
^ (0 

rH O 



(0 

o ^ 
0» < 

0» 

(0 s 

o 

AJ 

(Q H 



u 

(0 
fO 

o 

(0 

u 
u 

0 

AJ 

o 

(0 
(0 

0 

fO 

AJ 



CO 



o 
to 

to z 

o 

ro 

AJ >« 

fO 
tO 

0> W 
0» 

AJ 
AJ 



C7> 



a. 
u. 

O 
E 



0) 

o 
c 

0) 



I 

(0 

* o 

CO 

o 
c 

E 

CO 



CO 

a 
c 
o 

T> 
c 

I'D 

P 

■2 o Z 
u. - « 

2 



CO CO 

I? 

a c 



§ i 

cr a? 



O w 

- c 

li 

O CO 



n 



c 

CD 

co x: 
w *^ 

« 0) CO 

Sot 
£ © cc 

Q) o "5; 
a c 



c 



O 

c 

CD 
D 

ST v ' <u 

CO § CO 
CL 3 _ 

2£2 E 



03 

E 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



''21 



TO 

X 



ao 



o 



Z 

o 



ao 



X 
£ 

CD 



TO 

a. 



ID 
E 



-m a 

cd > 

u i_ 

CD <d 
g l/) 

G >N 
CDr-^ 

CD G} 

-M Q. 

C t/i 

cn a 

a 3 
g r- ■ 
cd to 

4J r— ' 

G -r- 

u c 

G 

g a 
u in 

G T- 1 

U JZ 

G CD 
CD S- 
G G 

4-> 0) 



a </i 

a >^ 

G r-* 

U CD 

-p a. 

u c 

a t/i 



— o 
CD > 



Li- 
CD 

£ 



m 
a. 

LL 
(5 

E 



+J i— « 

-M g 

cd > 

u s_ 

CD CD 

G 1/1 

G > 

Or—" 

CD CD 
G 

cd a 

a 3 

CD CD 

-P 0) 



u c 
a a 

U l/) 

u JZ 

C CD 
CD L. 

a a 

-P CD 
4-' r— 1 

g 

g >^ 

G i—' 
u CD 

• ' — 

— > CL 

u <z 
g '^2 

•u--rP 

0TG 

G 
G 



4-J G 
CD > 

■W. 

G ^ 
CD i— ' 
CD CD 

-P Cl 

G UO 
CD G 

G =3 
G r-i 
CD CD 

-P CD 

G -r-i 

u c 

c 10 

c c 

u to 

G 

u _c 

C CD 
G1 1- 

c a 

-P CD 



G l/l 

G > 

G 

U CD 

-p "5. 



u 

G 



O -s-> 
LD G 



LO G 



a 



•P O 
CD G 



<S .-^ 
i_n g •!— ' 



NO 

ch 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27^:5 



PCT/GB96/00481 



J '21 



C7> 




(sum Aavaiiaav) 3:N3DS3aomd iMimu 



SUBSTITUTE SHEET {RULE 26) 



WO 96/27675 PCT/GB96/00481 



9/ 



21 




Fig. 8 



SUBSTITUTE SHEET (RULE 26) 



7675 



PCT/GB96/00481 




SUBSTITUTE SHEET (RULE 26) 



WO 9ill 7675 



PCT/GB96/00481 




(pasjieujjou) eoueosajoni) 
SUBSTITUTE SHEET (RULE 26) 



WO $6/27675 PCT/GB96/00481 

,2 /21 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 




eoueqjosqe 
SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT7GB9G/00481 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



'5/ 



21 



cn 




(aasnvwdON) 33N33S3domj 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



16 



>Z1 



CD 
QJ 



5 



OJ (0 „ 

oi o» Q 

(0 (0 

u u 

u u J 

D (0 

oi oi w 

aj u 

Ol Ol > 

aj u 

aJ u 

U U «-! 

U iJ 

AJ AJ 

HJ HJ M 

ro (0 

u u 

o> o» > 

u u 

0) Oi> 

<0 0] 

Oi oio 

jj u 

0 u 

(0 d)H 

u u 

u w 

*j U U« 

XJ u 

AJ JJ 

U U -3 

<0 ru 

01 W 

oj *0 

<U ra 

Oi Oi UJ 

rC <u 

o> u> 

Ui Oi o 

<0 CO 

<U (0 

»u <o ^ 

*J 4J 

Ui Ot 

Ot Oi 

AJ u 

<o <u s: 



Ot i 

5 



u u 

(0 <u >* 

U ±J 

ro (U 

<J (j H 

<0 <o 

a) <o 

u u < 

Ol 01 

AJ IJ 

<0 «J Q 

O) O) 

JJ Li 

oi cn o 

0) Oi 

ra <0 

10 (0 Ui 

0> Oi 

u u 

oi ot o 

0» Oi 

0> Ot 

(0 fO UI 

cn cn 

aj ro 

Oi 0>O 

Oi Oi 

a u 

o» o» w 

<0 (0 

0 u 

AJ U > 

01 Ot 



aj 
U 



u 

U V) 
u 



u u lu 

AJ aJ 

(0 (0 

(0 <o u: 



Oi Ot 

oi at o 
o» o» 

u u 
ro 03 2 
(0 (0 

W xJ 
AJ *J > 

0> o» 

U xJ 
nj ro Q 
Oi 0> 

u XJ 

Oi Ot o 
0» Of* 



^ 0> 
Ot » 



(0 <0 

u u e« 

(0 (0 

u u a. 

u o 

Oi 0> 

Oi O) 3! 

4J xJ 



o a* 
u 



u u 

L> XJ > 

U> 0> 
JJ u 

u u a 
u u 



<o ro 

o> o» o 

0) Oi 

JJ JJ 

U U H 

<0 <0 

JJ 4J 

<0 <0 

u o 

01 Ol u 

JJ U 

JJ *J 

iJ U H 

(0 «0 



u 

JJ 



aj 

U 

u 

(0 (0 
ro (0 
(0 ro 

4J AJ 
AJ iJ 

u u 

u o 
u o 

ro ro 



*J U J 

U IJ 

(0 rO 

rO ro X. 

fO (0 

(0 rO 

Ol Ot O 

0> Ot 



4) 



to 
o. 

C Ol 
Oi i 
6 


*• l 

^ Ch 
Oi 1 


in 

a,^ 

^ Oi 
0» < 


^ Ot 
Ol i 


(0 Oi 

(rt (i< V* 

»u »w a 

(0 (0 


U O 

u i) iti 


J-l 4J »J 

u o 


u 

ro 
U 


o 

ro X 

U 


Oi Oi 
u u X 
fO (0 


ro U 
rO ru 


o u 

ro <0 


ro 
0 
0 


u 

Oi o 
Cn 


*0 rfl X 
U U 


AJ U 

(0 <0 


U 0 
fO (0 O 
Oi Oi 


C 

0 u 

U 4J 

JJ o 


0 

JJ J 

o 


iJ u 
*0 <0 Q 
0» Oi 


<U Ol 
tit iv 

(0 (0 


u ro 
0* Oi o 
0> Oi 


p; 

* w 

AJ 

U (0 


O 
aJ 
rO 


*0 (0 
O U 

o u 


rO Oi 

r fO It) U 

0> Oi 


rO 0) 
(0 rfl W 
01 Oi 


•H 

JJ o 
a ro 


0 

CO Z 

ra 


o u 

*0 rO Jh 

JJ 


Oi Oi 
ro O 

u u 


a u 
u u iu 
JJ u 


O ro 
0 

0 


ra 

Ol o 
Oi 


rO <0 

Ot oi a; 

40 (0 


(0 Ol 

AJ 4J > 

0> Ol 


Oi Oi 
ro <o 

fO (0 


u> 
fO 
0 


u 

ro a 
0> 


rO <0 
U U CO 
U U 


V 0 

ro (0 >h 

4J 4J 


U 0 
u u > 
Oi Ol 


<0 
(0 
0 


Oi 

ra Ui 
0> 


u u 

U tu 
u u 


W fO 

o» oi a 

0) 0) 


rO «0 W 
Ol Ol 


<0 
rO 
rO 


0) 

(0 X 
(0 


u o 

0> Ol o . 


(0 Ol 
rO rO W 
0) 0) 


4J JJ 

0 u < 

01 0) 


AJ 
AJ 
JJ 


o 

AJ U, 

JJ 


(0 ro 
(0 (0 C 
O U 


U 4J 

u u 


jj aJ 

Ol Ol CC 

u o 


JJ 

rO 
O 


JJ 

ro O 
Ol 


f ti ^ 
Ol Ol 


Ol Oi 
4J u S 

rO ro 


ro ro 
U U H 

(0 ro 


AJ 

U 

(0 


0 

AJ m 

(0 


u u 

Ol Ol o 
Ot Oi 


0 U 

U U < 

01 Ol 


Ol Ol 
*0 (0 « 
(0 ra 


AJ 

d 

Oi 


<d 

Ot o 
Oi 


u u 
(0 rO > 
u u 


u o 
0> Ol w 

fO ry 


u u 
(0 <o >« 
lJ U 


ra 

(0 
*U 


Ot 

ro 

ro 


iJ u * 

JJ iJ 


Ol Ui 

ra ra u; 

rO (0 


U (J 
( 0 fO 2*. 

to a) 


'U 

AJ 
Ui 


Ai 

JJ »J 

U 


O 0 

4J IJ U, 

u u 


U O 
u U U, 

u u 


Oi Oi 
Ot Oi o 
0» O) 


cn 

fU 
Ol 


o> 

ro W 

Oi 


4J U 

U U 
ro ro 


4J U 

U W (Li 

IJ *J 


0 U 

rO (0 D 

01 O) 


U 
*-> 
rO 


u 

iJ 

rO 


u u 
O O H 
(0 (0 


u u 

rO (0 Q 
Oi Oi 


Li 0 
fO rO Q 
01 Ol 


<0 
Oi 
(0 


Cn 

Oi u'. 
0) 


U O 
ti u > 
01 Ol 


u U 

to ro X 

u u 


ra 0) 
ra <0 U. 
rO (0 


u 

(0 
rU 


y 

fO 2 

i0 


u u 

U U J 

u u 


Oi Oi 

oi oi a: 
u u 


u u 

U JJ tu 


AJ 
AJ 

Oi 


0 

AJ > 

Oi 



00 

• 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



17/ 21 



CSI 

cu 



*H Ol 
Ol ' 

6 



u U 

* (0 Z 

(0 (0 

0» cn 

<0 <0 

<0 Ol 

«j <o o 

o u 



<0 
<0 

«o 
u 

O 
*0 

u 



u 

(J 



JJ 

<0 

03 



Ol 

<0 * 
t0 

U 

(0 o 

0 
Ol 
Ol 
(0 

u 

JJ M 

u 

<0 >H 

u 

<0 

u 

(0 z 
(0 

u 

tO X 
u 

u 

U V) 



o 

<0 z 
o 

JJ 

o 

(0 

u 

(0 >■ 
jj 

(0 

tO w 
O) 

Ol 

JJ ,J 



Ol 
»0 



in 

aw 

^ Oi 

o> » 


vn 
0i i 


^ Oi 

Oi i 


in 
a. 3 

^ Ol 
0. i 


(0 JJ 
U U < 
O) Of 


u 


JJ 

(0 X 

u 


u 
JJ 
Oi 


u 
JJ 

Oi> 


(0 <0 
tO (0 • 
U JJ 


(U u 
u u «J 

u u 


u 

<0 
0) 


O 

<0 2 
(0 


Ol 
JJ 

«o 


JJ 

<0 X 


<0 <0 

to <o ^: 

01 (0 


(Q <0 

o u 


U 0 
<0 (0 Q 
Ol Oi 


o 
*o 
u 


u 

fO 

U X 


u o 

(0 (0 > 
JJ JJ 


♦J O) 

JJ JJ > 

o» o» 


t0 
U 
U 


u cu 
u 


Ol 


u 

Oi Q 


tO A) 

JJ Jj J 

u o 


o u 
o» o> o 
<o cn 


(0 
u 
JJ 


to 

JJ J 
jj 


to 

Ol 
CO 


to 

Oi 

fO DC 


to to 
(0 to w 
Ol Oi 


(0 0 

O) o> o 
oi cn 


JJ 
JJ 

u 


JJ 

jj J 
0 


Ol 
<0 


Oi 
fO 

to * 


JJ Jj 

(0 (0 a 

Oi Ol 


jj u 
<o (0 a 
o» o» 


U U 
U JJ > 

cn oi 


<o <a 
*o *o 


Oi 0> 
JUS 
tO (0 


id (0 U1 

at oi 


jj 

u 
u 


JJ 

u 


U 
to 
IU 


u 

«0 

tO z 


u u 
o» Ol o 

Oi Ol 


JJ JJ M 

(0 fO 


u u 
Oi Oi o 
Ol Ol 


u 
u 
«J 


u 
u 


JJ JJ 
10 10 X 

u u 


U U 

S3 Z 


JJ JJ 

(0 <U Q 
0> 0> 


JJ JJ 

(0 eg 
Oi Oi o 


tO ro 

u u 

fO <0 


u o 
<o to x 
o u 


u u 
oi oi a 
o> o> 


03 
(0 


10 
*0 


JJ JJ 

JJ JJ H-t 

(0 ty 


<0 u 
Ol Ol Dd 
(U O 


jj 

u 


jj 

U M 

<U 


Ol 

u 
JJ 


Oi 

(J 

JJ CO 


Oi Oi 
Ol Ot o 
0» Ol 


JJ 0 

*J 0 jHi 

<0 (0 


<0 

o 
u 


10 

U Ou 
U 


1J 
JJ 
u 


JJ 
u 


JJ 

u u < 
Oi Oi 


<0 CT> 
<0 <0 X 


iJ 
o 
*u 


u 
iu 


u 
u 
o» 


u 
u 

OT< 


0 u < 

01 0) 


u o 

JJ 4J k 


JJ 

tO 
CO 


u 

10 Z 
<0 


u 
u 

u 


M 

o 

JJ (JJ 


U U H 
(0 rQ 


u u 
<D 10 Z 
(0 (U 


r0 

u 


«0 

io a 
u 


'0 

fO 
u 


u o 


tO to 
JJ JJ > 
Ol 0) 


U U 
JJ U < 
Ol O) 


tU 

* u 


(0 

u 


aj 
u 


fO 

u 


U JJ 

JJ JJ u, 
JJ JJ 


<0 tfl 

HJ tU id 


jj 
<U 


u 
JJ 


u 
u 


u 
u 

U I/) 


01 o» 

Ut Oi 


U U 

JJ JJ H-* 

*o <u 


(0 
O 


JJ 

V 


Ui 
tJ 

u 


0) 
JJ 

U lJ 


jj 4J 
u u J 

U L> 


<o u 
oi o» e> 

O) Oi 


u 
<u 

Oi 


JJ 

<U Q 
Oi 


u 
«J 

4^ 


u 


J f J 

o u 



00 
LT1 

C71 



SUBSTITUTE SHEET (RULE 26) 



WOM/27675 



PCT7GB96/00481 



18 



/21 



u 

CJ < 


cn Ci 


CJ 
03 

4-1 >< 


cj 

03 fr- 


CP 

m 

m ^ 


u 

4-J 

4-» Ui 


u 

4-J 

CJ J 


o 
u 

H CO 


03 
4-J 

J-J HH* 


03 
U 

03 E-< 


03 
U 

u a 


CP 

4-J 

03 X 


u 

4-> 

03 m 


u 

( ) 

03 e- 


u 
u 

H CO 


(0 


03 
CJ 

cn < 


CP 
CP 

-J 2 


4-J 
03 

CJ X 


CJ 

u 


cj 
m 

CP Q 


< 


4-> 

CT > 


4-> 
03 

cn Q 


03 
CJ 

u a. 


4-1 

03 

CP c 


CP 
CP 

m oc; 


03 
CP 

CP CJ 


< 

u 

E- CO 


4-J 

U .J 


4J 

cn 

cn cj 


4-> 
4-) 

CP > 


03 
U 

u a. 


03 


CP 
03 

CP W 


< 
E-< 


-u 

03 M 


03 
03 

CT CJ 


4~> 

u 


u 

03 

4-J >- 


CP 
03 

u o 


4-J 
4-> 

4-J tit 


u 

U J 


m 
cj 

CJ CL 


4-> 

CP 

cn cj 


03 
u 

o ~ 


03 
03 


cn 

4-J 

CP > 


CP 
03 

oj 


E-» 

U J 


U 

4-1 

cn> 


cn 

03 

& w 


03 
03 

03 X 


03 
U 

4-) CO 


CJ 
03 

4J >H 


u 

4J 

CP > 



< 

h h w n 

r-» \ 

^ H rH 

rH H rH 

IT) Eh Cu rH 

u 

H 

< M 

CJ 
H 

U rH 



E- 

cH 

CJ 



4J 

4J 



cn > m ct> o 

03 rH 4-J rH 

cn r- cn co 

cn CJ i«i 03 co eg 



03 

CP rH 

cn e? cn 

4-» rH 

U CP. 
«0 h (Nl 



4-> rH 

J-» rH 

i» Cn H 

U rH 

cn lo 

-u U ro 



00 rH 

CP ro 

t7> CJ rH 

C7> rH 

03 rH 

W T 



03 

m 

4-> 

u 

cn < 



E-« 



s 

CJ 
< 

CJ 
< 
< 

^ cj 

r-, H 

CM < 



4J 

u 

03 Eh 


cj 

4-J 

cn > 


4J 

0 

03 H 


cj 

4-) 

4~> tfci 


4-J 

u 

4J CO 


CJ 

cn 

-u u 


4-J 

±J 

U J 


4-» 
4-J 

4-J U* 


4-J 
4J 

03 r-» 


03 
03 

cn Du 


03 
03 

03 * 


*J 

-J U- 


03 
03 

CP CC 


CJ 
03 

CJ X 


03 
03 

03 X 


03 

cn 

cn cj 


CP 

cn 

cn cj 


~J 

U -4 


03 
03 

03 X 


4-J 
03 

03 2 


CJ 
CJ 

03 E-h 


4-1 

cn 

03 CO 


4-J 

4-J 

cn > 


4-) 

4-J 

(J J 


U 


4-J 


03 



03 
03 

cj a 

4J 

CP > 

4-J 

CP 

CP cj 

4-J 

03 

~J 

u 

-J CO 

CJ 



U 
03 



U 

03 ^ 



H rH 03 rH 03 <— i 

^ \ ^ \ 

^ oo CJ UJ r-H cn CJ cncjrsj 



U rH 
4-J O 
CP> r-i 



4-» CNJ 
U H 00 



4-J 
U 

u a* 


4J 

CT 

U OS 


4-J 


03 

u 

03 E-* 


u 
u 

CP < 


CP 
03 

03 ^ 


CJ 
CP 

03 CO 


O 
03 

-J >. 


CP 
03 


U 
03 

m h 


CJ 

4-J UL( 


CP 

cn 

CP CJ 


CJ 
XJ 


CJ 
03 

CT Q 


U 
03 

cn Q 


CJ 
03 

CP C 


U rH 

03 CNJ 

U X rH 


cn 

03 

03 X 


CP r-i 

o> CO 
U (X m 


C> 

4-J 

4-> lu 



cu 
cu 

00 
vO 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



19/ 



21 



u 
to 


U 
03 

03 2; 


4-> 
(J 

cn < 


03 


cn 

03 

03 


u 

-u 

U J 


O 

4-) 


cn 
03 

u o 


03 
03 

u o 


u 

4-) 

(0 M 


Cn 
03 

03 


Cn 

Cn> 


u 

03 

(tj 2: 


u 

03 

CPQ 


U 
cn 

C*C3 


03 

cno 


u 
u 

cn< 


U 
Cn 


u 

03 

CH Q 


Cn 
4-J 

03 2 


O 

m 

Cn Q 


Cn 
03 

Cnw 


U 

03 M 


m 

03 

cnuj 



mm p» 

H (0 ^ H 
^> \ 
cH (J 

^ 4J tu lD 



u »h 

oj <n 

4J >H rH 

03 rH 

4-J 

cn > ld 



U rH 

-M rS 

03 rH C\ 

U rH 

m m 

03 2; vo 



03 

u ac 
u 

03 

03 2; 

CJ 
03 

Cn Q 

03 
U 

u a, 

03 

4-J 

4J -4 



4J 

u 

4-J 

cn> 



U 

U 04 
U rH 

Cn no 
Cn o <N 
\ 

4-J rH 
03 h 

cn Q r- 



03 

Cn Q 


U 
03 

03 2; 


u 

03 

U X 


U 
Cn 

cnCD 


U 
♦J 

03 M 


0 
03 

U 3C 


u 

Cn 

U DC 


4J 

4-J 

03 rH 


0) 
cn 

CP O 


(J 
u 

4-> CO 


U 
U 

03 E- 


03 
U 

u a* 


Cn 
03 

03 X 


u 

03 

03 Z 


Cf 
03 

03 ^ 


4-> 

u 

03 H 


4J 

U h4* 


u 

03 


O 

4J U< 


03 

03 2: 


cn 

03 

cn 


0 

03 

03 2 


o 

03 

03 2 


03 
03 

u a 


V 

03 t— * 


CJ 
03 

4-J >. 


U 
U 

Cn< 


03 
03 

U O 


cn 
cn 

03 CC 


03 
Cn 


03 
0J 

03 iC 


4-> 

03 

4J > 


u *h 

03 \0 
03 ^ ^ 


CP rH 

-J _ CO 


U 

4-1 o 


aJ 

03 

<J ~ 


«-J O 

Cn > lo 


cr i— i 
oj <o 

03 iT) 


U <~- 
Cn CM 
Cn O v£> 


03 

cn Q 



CN 



00 



u 

4-J 

cn > 


U 
03 

u s 




cn 

03 S 


03 
03 

oj 




u 

03 

U DC 


u 




u 

03 

C«Q 


03 
4-J 

O ^ 




03 

03 PC 


03 
03 

Cn W 




Cn 

03 ^ 


4-> 

03 

CnQ 




03 
03 


Cn 

4J 

03 X 




U 


U 

cn O 




« O rH 

[ (J O, cvj 


4-J 
03 

U X 




4-J rH 

o3 p* 
cn Q r- 


m 

u 

03 H 




03 
03 

03 !< 


4-J 

4-J 

03 rH 




Cn 

4J CO 


Cn 
Cn 

cn e? 




4-J 

4_l 

U t-3 


cn < 




u 
u 


4-J 

U 

Cn< 




4-1 

o 

4-J 00 


03 

u 

03 E-» 




03 
03 

u o 


03 

4-J 

Cn> 




03 
U 

03 H 


4-J 
4J 

4-J Ut 


03 
03 

-U + 


O 
CJ 

4-J CO 


Cn 
03 

cn do 


U 

4~> 

U ^ 


Cn rH 
4-* ^ 
U ^ CM 


4-J rH 

4-J 

U rJ fNj 


OJ 
03 

Cn LJ 


C c-i 

03 «T 

-t-' >- 


o 

CJ -3 CD 


O 
03 

Cn Q 



"qj 

cu 

00 
vO 

tin 



SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 



/ 

**** "v- c 4 \ ( J v 

p ' 

; > ' ■ ■ *■ >• 

! * 1 V'f . - .* 

W , ^ 


} 

0 

f 

V v. 


V •' •• i : > 

. ^ ^ . r 

, • ... .■■ \ >• 


93' 




SUBSTITUTE SHEET (RULE 26) 



WO 96/27675 



PCT/GB96/00481 




SUBSTITUTE SHEET (RULE 26) 



INTERNATIONAL SEARCH REPORT 



Inte. iTia t ■ , .n N. 

PCT/CB «48 • 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 6 C12N15/82 C12N15/12 C07K14/435 G01N33/52 GG il' 33/53 



According to International Patent CI ass ft cin on (IPC) or to both national classification and IPC 



fi. FIELDS SEARCHED 



Minimum documentation searched (classification system followed by classification symbols) 

IPC 6 C12N C07K G01N 



Documentation searched other than minimum documentation to the extent that such documents arc included in the fields searched 



Electronic data base consulted during the international search (name of data base and, where practical, search terms used) 



C. DOCUMENTS CONSIDERED TO BE RELEVANT 



Category " Citation of document, with indication* where appropriate, of the relevant passages 



Relevant to claim No, 



p,x 



P.X 



TRENDS IN GENETICS, 

vol. 11, no. 8, August 1995, 

pages 328-329, XPQ02003595 

HASELOFF, J., ET AL.: "GFP in plants" 

see the whole document 

CURR. BIOL. (1996), 6(3), 325, 

pages 325-330, XP000571865 

CHUI, W., ET AL. : "Engineered GFP as a 

vital reporter plants" 

see the whole document 

WO, A, 95 07463 (UNIV COLUMBIA ; WOODS HOLE 
0CEAN0GRAPHIC INST (US); CHALFIE MARTIN) 
16 March 1995 
see the whole document 



1-5,10, 
20,21,24 



1-5,10, 
20,21,24 



| X| Further documents are lifted m the continuation of box C. 



m 



Patent family members arc listed in annex. 



Special categories of ated documents : 

A" document defining the general state of the art which n not 
considered to be of particular relevance 

E* earlier document but published on or after the international 
filing date 

L' document which may throw doubts on pnonty daimfs) or 
which is ated to establish the publication date of another 
citation or other special reason (as specified) 

"O* document referring to an oral disclosure, use, exhibition or 
other means 

*P' document published pnor to the international filing date but 
later than the priority date claimed 



T* later document published after the international filing date 
or pnonty date and not in conflict with the application but 
ated co understand the principle or theory underlying the 
invention 

*X" document of particular relevance; the claimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step when the document is taken alone 

*Y~ document of particular relevance; the claimed invention 
cannot be considered to involve an inventive step when the 
document is combined with one or more other such docu- 
ment!, such combinanon being obvious to a person skilled 
in the art 

*&' document member of the same patent family 



Date of the actual completion of the international search 



28 May 1996 



Date of mailing of the international search report 



07.06.96 



Name and mailing address of the ISA 

European Patent Office, P.B. 5818 Patendaan 2 
NL • 2250 HV Rtjswijk 
Tel. { + 31-70) 340-2040. Tx. 31 651 epo nl. 
Fa* (-31-70) 340-3016 



Authorized officer 



Maddox, A 



Form 210 (iccon* t*>«<) (July 1993) 



page 1 of 2 



INTERNATIONAL SEARCH IEPORT 



Intn nil Application No 

PCT/GB 96/00481 



^Continuation) DOCUMENTS CONSIDERED TO BE RELEVANT 



Category " Citation of document, with indicaOon. where appropriate, of the relevant passages 



Relevant to claim No. 



P.X 



p,x 



PLANT CELL REPORTS, 

vol. 14, April 1995, 

pages 403-406, XP000571886 

NIEDZ, R.P., ET AL.: "Green fluorescent 

protein : an in vivo reporter of plant 

gene expression" 

see the whole document 

THE PLANT JOURNAL, 

vol. 8, no. 5, November 1995, 

pages 777-784, XP002003596 

SHEEN, J., ETAL.: "Green-fluorescent 

protein as a new vital marker in plant 

cells" 

see the whole document 
SCIENCE, 

vol. 263, 11 February 1994, 

pages 802-805, XP002003599 

CHLAFIE, M. , ET AL.: "Green fluorescent 

protein as a marker for gene expression" 

see the whole document 

W0, A, 91 01305 (UNIV WALES MEDICINE) 7 
February 1991 
see claim 10 

NATURE, 

vol. 369, June 1994, 

pages 400-403, XPGG2 093600 

WANG, S., ET AL.: "Implications for bed 

mRNA localization from spatial 

ditribution of exu protein in Drosophila 

oogenesis" 

see the whole document 



23,24 



23,24 



1-23 



1-23 



23 



Form PCT1SAJ3IQ (awufluaww of taeond ihMt) (July \9f2) 



page 2 of 2 



INTERNATIONAL SEARCH REPORT 



Intel cul /\tf..Ui -.'J >r. .^o 

PCT/6B 9j/3)' ; 81 



Patent document 
cited in search report 


Publication 
date 


Patent family 
member (s) 


Publication 
date 


WO-A-9507463 


16-63-95 


US-A- 


5491084 


13-02-96 






AU-B- 


7795794 


27-03-95 






CA-A- 


2169298 


1 C AO AC 

16-03-95 


WO-A-9101305 


07-02-91 


AU-B- 
EP-A- 
JP-T- 


6054590 
0484369 
5501862 


22-02-91 
13-05-92 
08-04-93 



F«w PCT ISA/210 (paunt randy mmi) (Juty IW2) 



</(f«W3 <=W- COR. F<~u.\) 



I .f 



ORGANISATION MONDIALE DE LA PROPRIETE INTELLECTUELLE 
Bureau international 




PCT 

DEMANDE INTERNATIONALE PUBLIEE EN VERTU DU TRAITE DE COOPERATION EN MATIERE DE BREVETS (PCT) 



(51) Classification Internationale des brevets 6 : 
G01N 33/58 



A2 



(11) Nume>o de publication internationale: WO 98/55873 
(43) Date de publication internationale: 10 decembre 1998 (10.12.98) 



(21) Numero de la demande Internationale: PCT/FR98/01136 
_(22) Date de depdt international: 4 juin 1998 (04.06.98) 



(30) Donnees relatives a la priorite*: 

97/06977 5 juin 1997 (05.06.97) 



FR 



(71) Deposant (pour tous les Etats disignis saufUS): CENTRE NA- 

TIONAL DE LA RECHERCHE SCIENHFIQUE [FR/FR]; 
3, rue Michel-Ange, F-75794 Paris Cedex 16 (FR). 

(72) Inventeurs; et 

(75) Inventeurs/Deposants (US settlement): GALZI, Jean-Luc 
[FR/FR]; 37, rue Saint Aloise, F-67100 Strasbourg (FR). 
ALIX, Philippe [FR/FR]; II, rue de la Gare, F-14650 
Carpiquet (FR). 

(74) Mandataires: GROSS ET-FOURNIER, Chantal etc.; Gros- 
set-Foumier & Demachy SA.R.L., 103, rue La Fayette, 
F-75481 Paris Cedex 10 (FR). 



(81) Etats designes: CA, JP, US, brevet europeen (AT, BE, CH, 
CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, 
PT, SE). 



Publiee 



Sans rapport de recherche internationale, sera republiie dis 
reception de ce rapport. 



(54) Title: USE OF A FLUORESCENT PROTEIN FOR DETECTING INTERACTION BETWEEN A TARGET PROTEIN AND ITS 
LIGAND 

(54) Titre: UTILISATION D'UNE PROTEINE FLUORESCENTE POUR LA DETECTION D'lNTERACTTONS ENTRE UNE PRO- 
TEINE CIBLE ET SON LIGAND 

(57) Abstract 
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(57) Abrege* 

L'invention conceme l'utilisation d'une proline fluorescente choisie notamment parmi les prolines autofluorescentes, pour la 
detection de Pinteraction non covalente entre une prot6ine cible marquee par la proline fluorescente et Tun de ses ligands marquepar 
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5 

L ! invention concerne l'utilisation d'une proteine fluorescente pour la 
detection d' interactions entre une proteine cible et son ligand. 

De nombreux medicaments et substances naturelles exercent ieur action en 
interagissant avec des proteines regulatrices appelees recepteurs, impliquees 

10 dans de nombreuses fonctions physiologiques des organismes, et les alterations 
de leur fonctions sont la cause de nombreuses pathologies. L'accessibilit6 des 
recepteurs aux agents pharmacologiques endogenes ou exogenes, naturels ou 
synth6tiques, depuis l'ext6rieur de la cellule conduit h les considerer comme des 
cibles de choix pour la recherche de moldcules biologiquement actives, en 

15 particulier de molecules presentant des pouvoirs therapeutiques potentiels. 

Afm d' identifier de nouveaux outils pharmacologiques et produits 
m6dicamenteux, plusieurs tests de criblage de molecules biologiquement actives, 
ont 6te developp6s : 

- le test SPA ou test de proximity par scintillation (scintillation proximity 

20 assay) (Udenfirend et al Anal. Biochem. (1987) 161:494-500, brevet americain 
n° 4,568,649; brevet europ6en 0,154,734 et demande de brevet japonais 
n° 84//S2452) ne parvient pas k s'affranchir de l'utilisation de molecules 
radioactives, et done de toutes les nuisances associ6es a la manipulation, 
l'utilisation et le stockage de radio61ements; 

25 - le test de mesure par transfert d'6nergie de fluorescence utilisant le 

couple europium - allophycocyanine (Mathis. clin. Chem. (1993), 22:1953- 
1959) requiert l'utilisation d ! allophycocyanine purifi6e et h6cessite son greffage 
sur une proline cible elle aussi purifi6e, ce qui n ! est pas toujours possible 
surtout lorsque la proteine cible n'est pas abondante ; 

30 - les tests fonctionnels faisant intervenir la regulation de genes 

rapporteurs codant pour des prot6ines luminescentes, ou pourvues d'une activite 
enzymatique dos6e par colorim6trie, sont des mesures tres indirectes de 
l f interaction entre un ligand et son r6cepteur, peuvent etre source de faux- 
positifs, font intervenir des cascades d' amplification qui interfered avec la 

35 mesure quantitative des interactions entre le recepteur et ses ligands, et ne sont 
applicables que sur des systeme biologiques couples a une transcription des 
genes (Broach, J.R. &Thorner, J. 1996, Nature 384 g u pp. 14-16 ^ ; 
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- un test de mesure par fluorescence permettant la detection de la liaison 
d'un messager secondaire intracellulaire (le nucl6otide cyclique AMPc) 
d6veloppe par greffage d'un site de liaison du messager secondaire sur la 
proteine fluorescente verte (GFP) de m6duse Aequorea victoria (Thastrup et al 
5 W096/23898). Ce test qui permet la detection de mol6cules biologiquement 
actives se limite aux analogues de messagers secondares affectant des processus 
intracellulaires. 

Le g£ne codant pour une proline fluorescente issue de la meduse 
Aequorea victoria, la proteine fluorescente verte (green fluorescent protein ou 

10 GFP) (Prasher et al 1992, Gene 111:229-233), a 6t6 rteemment dechiffr6. La 
GFP est une proline monomerique. Elle acquiert ses propri6t6s de fluorescence 
par un m6canisme autocatalytique de formation du fluorophore. L'expression, 
endogfcne ou heterologue, de la GFP tie requiert qu'un g£ne et ne n6cessite 
1' addition d'aucun groupe prosth6tique. La GFP a 6te exprim6e de maniere 

15 h&6rologue dans des cellules et organismes aussi divers que les bacteries, les 
levures, les cellules eucaryotes animales et v6g6tales. La structure de la GFP 
(Ormo et al 1996, Science 222:1392-1395 ; Yang et al 1996, Nature 
Biotechnology, 14:1246-1251) permet son greffage sur d'autres polypeptides, 
soit du c6t6 ammo-terminal soit du c6t6 carboxy terminal sans pr6judice ni vis- 

20 k-vis de son taux d'expression, ni vis-k-vis de la formation du fluorophore. La 
GFP a ainsi pu etre coupl6e, par fusion de gfenes, k des prot6ines solubles ou 
membranaires. Enfin, les codons contenus dans le gfcne naturel ont ete 
remplaces par les codons pr6f6r6s des organismes hotes (EGFP [Cormack et al 
1996, Gene 122:33-38] par exemple, pour l'expression dans les cellules 

25 eucaryotes animales) et diverses mutations permettent de modifier ses spectres 
d 1 absorption et d'6mission de lumiere et rendent possible des dfetections 
multiples dans un syst&me d' expression unique. 

L' invention a pour but notamment la pr6paration de proteines cibles, 
notamment des r6cepteurs, rendu(e)s fluorescent(e)s par fusion avec une 

30 prot6ine fluorescente, d'une part, de leurs ligands marqu6s, d'autre part, et leur 
utilisation pour la detection d 1 interactions entre les recepteurs fluorescents et 
leurs ligands marques et l r identification de nouvelles molecules biologiquement 
actives. 

L'un des autres aspects de 1' invention est un proc6d6 simple a mettre en 
35 oeuvre, rapide, sensible, permettant d'effectuer des mesures quantitatives, k 
Tequilibre et en temps r6el, d ! interactions non covalentes entre une prot6ine 
cible et son ligand. 
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L'un des autres aspects de l'invention est de proposer un proc6d6 
g6n6ralisable a de nombreuses prot6ines cibles et & leurs ligands. 

L ! un des autres aspects de l'invention est de proposer un proc6de ne 
necessitant ni la purification de la proline cible, ni celle du ligand. 
5 L ! un des aspects de V invention est de proposer un proc6de non polluant 

puisqu'il n'utilise pas de radioactivity 6conomique puisqu'il utilise la lumiere 
visible (pas de quartz) sur les equipements disponibles et ne n6cessitant aucune 
filtration. 

L'un des autres aspects est de proposer un procede automatisable. 
10 L'invention a pour objet la construction de d'ADNc contenant une 

sequence codant pour 

1) une prot6ine, notamment un recepteur, dans lequel un ou plusieurs 
acides aminds sont substitues, ins6res ou d61et6s, fusionnee. avec l'ADNc 
codant pour la GFP, ou l'un de ses mutants, dans lequel un ou plusieurs acides 

15 amines sont substitues, inserts ou d616t6s afin de maintenir la phase de lecture 

et d 'obtenir un polypeptide hybride. 

L'invention a 6galement pour objet des cellules contenant une sdquence 

d'ADN codant pour une prot6ine, notamment un recepteur, dans lequel un ou 

plusieurs acides amines sont substitues, ins6res ou del6tes, fusionn6e avec 
20 l'ADNc codant pour la GFP, ou Tun de ses mutants, dans lequel un ou 

plusieurs acides amin6s sont substitu6s, insures ou d616tes afin de maintenir la 

phase de lecture et capable d f exprimer la sequence d 1 ADN consid6r6e. 

L'invention a egalement pour objet la production de ligands 

pharmacologiquement actifs contenant un groupe chimique fluorescent lie par 
25 une rdaction chimique dans lequel le groupe fluorescent est soit donneur 

d^nergie pour la GFP ou Tun de ses mutants, soit accepteur d f energie de la 

GFP ou de Tun de ses mutants. 

L'invention a 6galement pour objet la culture de cellules contenant 

I 1 hybride prot6ine-GFP dans des conditions permettant 
30 1) Texpression du polypeptide hybride, 

2) la detection de fluorescence de la cellule. 

L ! invention a 6galement pour objet Tincubation de cellules exprimant 
T hybride proteine-GFP avec le ligand fluorescent, la mesure des changements 
de fluorescence soit d'emission du donneur, soit d ! emission de Taccepteur, soit 
35 d* excitation de V accepteur, r6v61ant l 1 interaction proline ligand, ainsi que 

1' addition d'une moldcule suspect6e biologiquement active avec le ligand 
fluorescent et la mesure des alterations du signal de transfert d'energie par 
rapport a T incubation des susdites cellules avec le ligand fluorescent. 
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L ! invention a 6galement pour objet la construction d'ADNc contenant une 
sequence codant pour 

1) un polypeptide, notamment un ligand, dans lequel un ou plusieurs 
acides amines sont substitutes, ins6r6s ou delates, ftisionne avec l'ADNc codant 
5 pour la GFIV notamment son mutant S65T ou S65C, dans lequel un ou 

plusieurs acides amines sont substitues, inseres ou del6tes afin de maintenir la 
phase de lecture et d'obtenir un polypeptide hybride. 

L' invention a 6galement pour objet des cellules contenant une sequence 
d'ADN codant pour un polypeptide, notamment un ligand, dans lequel un ou 
10 plusieurs acides amin6s sont substitues, ins6r6s ou d616tes, fusionn6 avec 

l'ADNc codant pour la GFP, notamment son mutant S65T ou S65C, dans 
lequel un ou plusieurs acides amines sont substitues, inser6s ou deletes afin de 
maintenir la phase de lecture et capable d'exprimer la sequence d'ADN 
consider6e. 

15 L' invention a 6galement pour objet la culture de cellules contenant 

1' hybride ligand-GFP dans des conditions permettant 

1) T expression du polypeptide hybride, 

2) la d6tection de fluorescence de la cellule, 

3) l'isolement de 1'hybride ligand-GFP. 

20 L 1 invention a 6galement pour objet T incubation de cellules exprimant 

T hybride prot6ine-GFP, notamment un recepteur fusionn6 avec le mutant BFP 
(GFP Y145F Y66H) avec 1'hybride ligand-GFP, notamment le mutant S65T 
ou S65C de la GFP et la mesure les changements de fluorescence soit 
d'6mission du donneur (prot6ine-GFP), soit d'emission de l'accepteur (ligand- 

25 GFP), soit d ! excitation de Taccepteur, revelant 1' interaction prot6ine ligand et 

l'addition d'une molecule suspectee biologiquement active avec l'hybride 
ligand-GFP et la mesure des alt6rations du signal de transfert d'6nergie par 
rapport a 1' incubation des cellules exprimant 1 ! hybride proteine-GFP et 
rhybride ligand-GFP. 

30 Ces diff6rents aspects sont obtenus par Tutilisation d'une proteine 

fluorescente choisie parmi les proteines fluorescentes issues ou d6riv6es de 
prot6ines autofluorescentes de cnidaires, notamment choisie parmi : 

- la proteine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition, deletion ou substitution 
35 d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 

propri6te de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propri6t6 de fluorescence, 
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pour la detection et la quantification d 1 interactions non covalentes entre une 
proline cible marquee par la GFP ou Tun des variants ci-dessus definis ou Tun 
des fragments ci-dessus definis et Tun de ses ligands marque par un marqueur 
constitu6 : 

- soit par une mol6cule susceptible d' absorber la lumiere emise par la 
prot6ine fluorescente, 

- soit par une substance fluorescente, 

cette detection et quantification ay ant lieu par transfert d'6nergie de 
fluorescence: 

. entre la GFP ou 1'un des variants d6finis ci-dessus, ou Tun des 
fragments definis ci-dessus et la susdite substance fluorescente, la 
substance fluorescente 6tant telle que soit elle est excitable k la 
longueur d'onde d' emission de la GFP ou de Tun des susdits 
variants, ou de Tun des susdits fragments, soit elle 6met a la 
longueur d'excitation de la GFP, ou de Tun des susdits variants, ou 
de Tun des susdits fragments, ou 

. entre la GFP ou Tun de ses variants definis ci-dessus, ou Tun des 
fragments d6finis ci-dessus, et la susdite mol6cule susceptible 
d' absorber la lumiere 6mise par la proline fluorescente. 
L 1 invention a notamment pour objet rutilisation d'une protdine 
fluorescente choisie parmi les prot6ines fluorescentes issues ou deriv6es de 
prot6ines autofluorescentes de cnidaires, dont le coefficient d'extinction 
moleculaire est supdrieur k environ 14000M" 1 cm" 1 et le rendement quantique de 
fluorescence est superieur a environ 0,38, notamment choisie parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition, del6tion ou substitution 
d'un ou plusieurs acides amin6s, sous reserve que ces variants conservent la 
propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propri6t6 de fluorescence, 

pour la detection et la quantification d' interactions non covalentes entre une 
prot6ine cible marquee par voie g6n6tique par la GFP ou Tun des variants ci- 
dessus d6finis ou Tun des fragments ci-dessus definis et Tun de ses ligands 
marque par un marqueur constitu6 : 

- soit par une molecule susceptible d' absorber la lumiere 6mise par la 
proteine fluorescente, 

- soit par une substance fluorescente, 
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cette detection et quantification ay ant lieu par transfert d'6nergie de 
fluorescence: 

entre la GFP ou l'un des variants d6finis ci-dessus, ou Tun des 
fragments definis ci-dessus et la susdite substance fluorescente, la 
substance fluorescente etant telle que soit elle est excitable a la 
longueur d'onde d'emission de la GFP ou de l'un des susdits 
variants, ou de l'un des susdits fragments, soit elle 6met a la 
longueur d'excitation de la GFP, ou de l'un des susdits variants, ou 
de l'un des susdits fragments, ou 

entre la GFP ou l'un de ses variants d6finis ci-dessus, ou l'un des 
fragments ddfinis ci-dessus, et la susdite molecule susceptible 
d' absorber la lumiere emise par la prot6ine fluorescente. 
La pr6sente invention comporte les avantages suivants: La sensibilit6 de la 
d6tection de la cible et/ou du ligand obtenue par fusion avec la proteine 
15 fluorescente est telle que des concentrations de l'ordre du picomolaire sont 
aisdment d6tectables. Par le fait que la fluorescence est introduite sur la cible 
(parfois aussi sur le ligand) par manipulation genetique, il resulte qu'il n'est pas 
necessaire de disposer de la proteine que l'on souhaite rendre fluorescente, ce 
qui permet de detecter des prolines dont l'abondance naturelle empeche tout 
20 marquage chimique par manque de quantites manipulables (proteine non isolee 
ou non isolable) de celle-ci. 

Le marquage par voie g6n6tique offre en outre deux avantages 
suppl6mentaires, a savoir, quantite et homogen6it6. Par opposition au marquage 
chimique qui peut survenir dans certains cas de maniere partielle et mhomogene, 
25 la marquage par voie g6n6tique est quantitatif et survient a une position 
pr6determinee et connue. II en resulte que toutes les molecules sont marquees et 
qu'elles sont toutes marqu6es de maniere identique. 

L' invention consiste a d6tecter des interactions non covalentes entre une 
proteine et l'un de ses ligands, par transfert d'energie de fluorescence, et a 
30 utiliser ce proced6 dans le criblage de molecules biologiquement actives, 

notamment dans le domaine des recepteurs. La proteine est rendue fluorescente 
par fusion de son ADNc avec l'ADNc codant pour la GFP, le ligand est rendu 
fluorescent soit par greffage chimique d'un groupe fluorescent, soit par fusion 
de son gene avec celui de la GFP. L' interaction entre la proteine et son ligand 
35 entraine des modifications du spectre de fluorescence de la GFP et/ou du 

ligand, qui peuvent etre enregistr6s en temps reel ou a l'equilibre. 

L' interaction non covalente entre une proline cible et son ligand 
correspond a la formation d'un complexe entre la prot6ine cible et le ligand 
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dans lequel la proline cible et le ligand interagissent Tune avec l'autre, et sont 

retrouves intacts aprfes suppression de r interaction 

Une serie de tests permettant de d6terminer la nature non covalente, 

sp6cifique et saturable de l 1 interaction est notamment decrite dans les articles 
5 suivants : Levitski, A. 1980, in Cellular receptors for hormones and 

neurotransmitters, Eds Schulster, D. & Levitski, A., John Wiley & Sons Ltd.; 

Horovitz, H. and Levitski, A. 1987, Proc. Natl. Acad. Sci. £4:6654-6658; 

Receptor Biochemistry and Methodology, volume 3, Ventre, J.C. & Harrison, 

L.C. Eds, Alan R. Liss, INC, New York, 1987. 
10 Dans le contexte present, les termes suivants sont d6finis ainsi : 

- proline autofluorescente : proteine synth6tique ou naturelle dans 
laquelle le chromophore se forme par une reaction autocatalytique entre des 
acides amin6s de la proteine sans n6cessiter 1' addition d'un groupe prosthetique 
et dont les propri6t6s de fluorescence sont intrinseques au monomere, 

15 - "polypeptide hybride" : indique un polypeptide qui est une fusion d'au 

moins une partie de deux prolines, dans Tinvention, a titre d'exemple au moins 
une partie de la GFP avec une partie d'une proline cible ou une partie d f un 
ligand polypeptidique de la proline cible, 

- "comp6titeur" : toute mol6cule se liant sur la proteine cible au meme 
site que le ligand fluorescent, 

- "substance biologiquement active" r toute substance susceptible 
d'interf6rer avec T interaction d ! un ligand fluorescent et de la proline 
fluorescente sp6cifique en modifiant les parametres cin&iques ou 
thermodynamiques de 1' interaction. 

On appelle ligand toute moldcule qui interagit avec une autre mol6cule de 
maniere non covalente et r6versible. 

L'expression "transfert d'energie de fluorescence" correspond & un 
processus physique, dependant de la distance, par lequel de T6nergie est 
transmise de maniere non radiative d'un chromophore excitS, le donneur, a un 
30 autre chromophore, l'accepteur, par interaction dip61e-dipole (Forster 1951 in 

Fluoreszenz organischer Verbindung. Vandenhoek and Rupprecht, Gottingen; 
Wu and Brand 1994 Anal. Biochem. 218:1-13; Clegg 1995, Current Opinion 
in Biotechnol. &1103-110). Le transfert d'energie peut etre observ6 soit par une 
diminution de T amplitude de remission du donneur, soit par une augmentation 
35 de l' amplitude de Texcitation et de remission de l'accepteur. 

Dans le cas de T application du transfert d'energie k des 6chantillons 
biologiques en interaction non covalentes, le signal de transfert ne peut pas 
persister si les conditions experimentales ne permettent pas 1 ! interaction entre 
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le ligand fluorescent et la proteine cible fluorescente. De raeme, si l'un des 
deux partenaires interagissant n'est pas fluorescent, les eventuelles variations 
de fluorescence .observees pour r autre partenaire ne pourront pas etre 
attribu6es a un processus de transfert d'energie. 

Les termes changement ou variation de fluorescence, definis dans le 
contexte du transfert d'energie, se r6ferent a toutes modifications de 1) 
l'amplitude du signal de fluorescence du donneur, de 2) l'amplitude du spectre 
d'excitation ou 3) l'amplitude du signal demission du donneur. Les variations 
ou changements de fluorescence ne doivent pas etre observes si l'un des deux 
partenaires n'est pas fluorescent ou si l'interaction entre les partenaires 
fluorescents est inhib6e, par exemple par un exces d'un agent competiteur. 

De facon plus pr6cise, la reaction de transfert d'6nergie de fluorescence 
requiert deux groupes fluorescents, l'un appel6 donneur et 1' autre accepteur. 
Cette reaction se produit lorsque deux conditions sont reunies : 

1) le spectre d'absorption de l'accepteur et le spectre d'emission du 
donneur doivent se recouvrir, au moins en partie ; le recouvrement se calcule a 
partir de donn6es ex P 6rimentales et d'une equation dormant une valeur en 
cn^M" 1 (Lakey et al 1991, J. Mol. Biol. 21&639-653) ; 

2) le donneur et l'accepteur doivent etre proches dans l'espace (de 10 a 
100 angstroms) afra que le transfert d' 6nergie puisse avoir lieu. 

La premiere condition a pour consequence le fait que l'excitation du 
donneur entraine alors de maniere concomitante une diminution de l'amplitude 
de remission .du donneur et l'apparition d'un signal d'emission de l'accepteur. 
Ceci permet de detecter les interactions entre le donneur et l'accepteur et/ou de 
mesurer leur distance. 

L' expression "proches dans l'espace- signifie que la distance entre le 
donneur et l'accepteur est inf6rieure ou egale a 2 Ro, Ro repr6sentant le rayon 
de Forster (op.cit.) (Lakey, J.H. et al 1991, J. Mol. Biol. 218:639-653). 

Si l'accepteur n'est pas fluorescent, mais pr6sente un spectre d'excitation 
recouvrant au moins en partie le spectre d'emission du donneur, le transfert 
d'energie pourra etre detects sous la forme d'une reduction d'amplitude de 

l'6mission du donneur. 

L' invention concerne 1 'utilisation d'un ligand marqu6 par un marqueur 

constitud : 

- soit par une molecule susceptible d' absorber la lumiere emise par la 
prot6ine fluorescente, 

- soit par une substance fluorescente, 
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pour la detection et la quantification d' interactions non covalentes entre une 
prot6ine cible et le susdit ligand, ladite prot6ine cible 6tant marquee par voie 
genetique par une proteine fluorescente choisie parmi les prot6ines fluorescentes 
issues ou deriv6es de proteines autofluorescentes de cnidaires, dont le coefficient 
5 d'extinction moleculaire est superieur a environ l^-OOOM^cm* 1 et le rendement 
quantique de fluorescence est superieur k environ 0,38, notamment choisie 
parmi : 

- la proteine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition , d616tion ou substitution 
10 d'un ou plusieurs acides amin6s, sous reserve que ces variants conservent la 

propriete de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propri6t6 de fluorescence, 

cette detection et quantification ay ant lieu par transfert d'energie de 

15 fluorescence: 

. entre la GFP ou Tun des variants d6finis ci-dessus, ou Tun des 
fragments definis ci-dessus et la susdite substance fluorescente, la 
substance fluorescente 6tant telle que soit elle est excitable a la 
longueur d'onde d'emission de la GFP ou de Tun des susdits 

20 variants, ou de Tun des susdits fragments, soit elle 6met a la 

longueur d ! excitation de la GFP, ou de Tun des susdits variants, ou 
de Tun des susdits fragments, ou 

. entre la GFP ou Tun de ses variants definis ci-dessus, ou Tun des 
fragments definis ci-dessus, et la susdite mol6cule susceptible 
25 d'absorber la lumiere 6mise par la proteine fluorescente. 

Selon un mode de realisation avantageux, la proteine fluorescente est 
choisie parmi : 

- la proline fluorescente verte (GFP) (Ward et al 1980, Photochem. 
Photobiol. 21:611-615 ; Chalfie 1995, Photochem. Photobiol. £2:651-656), ou 

30 EGFP (Heim & Tsien, Current Biology, 1996, vol. n° 6, pl78-182 ; Miyawaki 
et al., Nature 1997, vol. 388, p882-887), 

- la proteine fluorescente cyan (CFP ou ECFP) (Heim & Tsien, Current 
Biology, 1996, vol. n° 6, pl78-182 ; Miyawaki et al., Nature 1997, vol. 388, 
p882-887), 

35 - la proteine fluorescente jaune (YFP ou EYFP) (Cormack et al 1995, 

Gene 121:33-38 ; Heim, Cubitt et Tsien 1995, Nature ; Ehrig et al 1995, FEBS 
Lett. 262:163-166) (Miyawaki et al., Nature 1997, vol. 388, p882-887), 
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- GFPUV (Crameri etal 1996, Nature Biotechnol. 14:315-319 ; Ehrig 
et al 1995, FEBS Lett. 262:163-166), 

ou leurs mutants dans lesquels les codons sont optimisds pour 1' expression dans 
les cellules humaines, bact6riennes ou v6getales, 
5 ou leurs mutants pr6sentant des longueurs d ! excitation ou d'emission plus 
elevees ou plus faibles que celles assoctees aux prolines d6fmies ci-dessus, sous 
reserve que leur coefficient d* extinction moleculaire soit superieur h environ 
WOOOM^cm" 1 et leur rendement quantique de fluorescence soit supSrieur a 
environ 0,38. 

10 L'expression "codons optimis6s" indique la substitution de codons de la 

proteine sauvage par leurs homologues pref6r6s de l'organisme hote, sans 
changement de code done sans changement de sequence prot6ique. 

La GFP sauvage (WT) de longueur d'onde, d'excitation et d' Emission 
395/470-509 est decrite dans ref: Ward et al 1980 Photochem. Photobiol. 

15 21:611-615, Chalfie 1995, Photochem. PhotobioL 62:651-656. 

La GFP UV pr6sentant les mutations suivantes : F99S, M153T, V163A de 
longueur d'onde, d'excitation et d'emission respectivement de 395-510 est 
d6crite dans Crameri et al 1996 Nature Biotechnol. 14:315-319. ou avec la 
mutation T203I et la longueur d'onde respectivement d'excitation et d 1 emission 

20 400-512 est d6crite dans Ehrig et al 1995 FEBS Lett. 262:163-166. 

La EGFP presente les mutations suivantes : 

F64L S65T H231L 

La EYFP presente les mutations suivantes : 

S65G V68L S72A T203Y 

La ECFP presente les mutations suivantes : 

F64L S65T Y66W N146I 

M153T V163A N212K 

25 

Les differents mutants de GFP peuvent en outre etre optimises (par 
l 1 introduction de mutations silencieuse optimisant 1' usage de codons sp6cifiques 
k chaque esp&ce) pour 1 ! expression dams ces cellules : 

- humaines, ref Haas et al 1996 Curr. Biol. 6:315-323; Yan et al 1996, 
30 Nucleic Ac. Res. 24:4592-4593; Zolotukhin et al 1996, J. Virol. 2Q:4646-4654 

- bact6riennes : Crameri et al 1996 Nature Biotechnol. 14:315-319, 
Cormack et al 1996, Gene, 122:33-38 pour Escherichia coli, 

- veg6tales: Reichel et al 1996, Proc. Natl. Acad. Sci. 22:5888-5893. 
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. GFP : 

Le terme GFP indique une proline cod6e par la sequence nucleotidique 
donn£e en figure 1, et qui une fois exprimSe dans des cellules 6met une 
fluorescence. Les GFPs presentant des substitutions, additions ou deletions 
5 d'acides amines influenpant soit les propri6t6s de fluorescence, soit le taux 

d 1 expression de la GFP sont appel6s mutants de GFP. 

On donne ci-aprfes les principales caracteristiques des proteines 
fluorescentes avantageusement utilises dans le proced6 de 1* invention : 



Proteine 


X-excitation 
maximale 


A.-6mission 


coefficient 
d' extinction 


rendement quantique 


EYFP 


514 


527 


36500 


0,63 


ECFP 


432 


480 


18000 


0,67 


GFPUV 


395 


509 


21000 


0,77 


EGFP 


489 


511 


39000 


0,66 



10 

La prot6ine autofluorescente BFP est de preference exclue car elle ne 
repond pas aux conditions d6fines pour les prolines autofluorescente de 
cnidaire, k savoir coefficient d'extinction mol6culaire sup6rieur a 14000 M" 
'cm' 1 et rendement quantique de fluorescence sup6rieur k 0,38. 
15 L' invention concerne 6galement 1'utilisation d ! une proteine fluorescente 

(n° 1) telle que d6finie ci-dessus, dans laquelle le ligand est marqu6 
* soit par une substance fluorescente, le marquage etant : 

- soit effectue par voie chimique, la substance fluorescente etant alors un 
compos6 chimique, 

20 - soit effectu6 par voie recombinante, la substance fluorescente 6tant 

alors un peptide ou une proline fluorescente (n° 2), et pouvant etre notamment 
choisie parmi les proteines fluorescentes issues ou d6rivees de proteines 
autofluorescentes de cnidaires, dont le coefficient d'extinction moleculaire est 
sup6rieur k environ MOOOM^cm" 1 et le rendement quantique de fluorescence est 

25 superieur a environ 0,38, notamment choisie parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition , del6tion ou substitution 
d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propri6t6 de fluorescence, 

30 - ou des fragments de la GFP, ou de fragments des susdits variants, sous 

r6serve que ces fragments conservent la propriete de fluorescence, 
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* soit par une substance non fluorescente appartenant au groupe des acides 
violets [Acid Violet 5, CAS 10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ; Acid • 
Violet 17, CAS 4129-84-4], acides rouges [Acid Red 1, CAS 3734-67-6 ; Acid 
Red 8, CAS 4787-93-3 ; Acid Red 37, CAS 6360-07-2 ; Acid Red 40, CAS 
5 12167-45-2 ; Acid Red 106, CAS 6844-74-2 ; Acid Red 114, CAS 6459-94-5], 
les alizarines, 1'aluminon, l'azocarmine B [CAS 25360-72-9], la fuschine 
basique [Basic Red 9, CAS 569-61-9], le Bordeaux R [Acid Red 17, CAS 5858- 
33-3], la Carmine [CAS 1390-65-4]. 

"CAS" correspond a Chemical Abstracts. 
10 . Marquage : 

Par marquage d'une prot6ine cible ou d'un ligand, on entend: 

- pour la prot6ine cible, la fusion de son gene ou ADNc, ou partie du 
gene ou de l'ADNc, avec le gene ou ADNc, ou partie du gene ou ADNc, de la 
GFP; 

15 . pour le ligand, il peut s'agir d'un couplage chimique entre le ligand et 

un groupe fluorescent, ou bien de la fusion de son gene ou ADNc, ou partie du 
gene ou de l'ADNc, avec le gene ou ADNc, ou partie du gene ou ADNc, de la 
GFP. 

L'invention concerne l'utilisation d'une proteine fluorescente selon 
20 l'invention dans laquelle la prot6ine cible et le ligand sont marques par voie 
genetique, la prot6ine fluorescente et la substance fluorescente 6tant 
respectivement choisies parmi les couples de composes suivants : 
GFPUV-EYFP 
EYFP - GFPUV 
25 ECFP - EYFP 

EYFP - ECFP 
ECFP - EGFP 
EGFP - ECFP 
EGFP - EYFP 
30 EYFP -EGFP 

et notamment dans laquelle la proteine cible est marquee par la prot6ine 
EYFP ou EGFP et le ligand est marqu6 par la proteine ECFP, ou la proteine 
cible est marqu6e par la proteine ECFP et le ligand est marque par la proteine 
EYFP ou EGFP. 

35 L'invention a egalement pour objet l'utilisation d'une proline fluorescente 

choisie parmi les prot6ines fluorescentes issues ou derivees de prot6ines 
autofluorescentes de cnidaires, dont le coefficient d' extinction mol6culaire est 
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superieur a environ MOOOM-'cm 1 et le rendement quantique de fluorescence est 
sup6rieur a environ 0,38, notamment choisie parmi : 

- la proline fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition, d6I6tion ou substitution 
5 d'un ou plusieurs acides amin6s, sous reserve que ces variants conservent la 

propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propriete de fluorescence, 

pour la detection et la quantification d' interactions non covalentes entre 
10 une proline cible marqu6e par la GFP ou I'un des variants ci-dessus definis ou 
l'un des fragments ci-dessus d6finis et l'un de ses ligands marque" par une 
substance fluorescente, cette detection et quantification ayaht lieu par transfert 
d'6nergie de fluorescence entre la GFP ou l'un des variants definis ci-dessus, ou 
l'un des fragments deTmis ci-dessus et la susdite substance fluorescente, la 
15 substance fluorescente 6tant telle que soit elle est excitable a la longueur d'onde 
d'emission de la GFP ou de l'un des susdits variants, ou de l'un des susdits : 
fragments, soit elle 6met a la longueur d'onde d'excitation de la GFP, ou de l'un 
des susdits variants, ou de l'un des susdits fragments. 

Selon un mode de realisation avantageux de 1' invention, la prot6ine 
20 fluorescente est EGFP et dans laquelle : 

- soit la EGFP est donneur d'energie de fluorescence et le marqueur 
absorbant la lumiere emise par la EGFP est une substance fluorescente ou non, 
et le marqueur 6tant choisi parmi des substances, dont ie spectre d'excitation 
chevauche le spectre d'emission de la EGFP, et notamment dans le cas ou le 

25 marqueur est une substance fluorescente, il est choisi parmi : le 4,4-difluoro-4- 
bora-3a,4a-diaza-s-indacene (Bodipy), l'eosine, l'6rythrosine, la 
t6tramethylrhodamine, la sulforhodamine 101 commercialis6e par Molecular 
probe sous la denomination Texas Red, et leurs denv6s permettant d'une part le 
greffage et, d'autre part, dont le spectre d'excitation recouvre le spectre 

30 d ' amission de EGFP, 

et dans le cas ou le marqueur n'est pas une substance 
fluorescente, il est choisi parmi le groupe des acides violets [Acid 
Violet 5, CAS 10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ; 
Acid Violet 17, CAS 4129-84-4], des acides rouges [Acid Red 1, 
35 CAS 3734-67-6 ; Acid Red 8, CAS 4787-93-3 ; Acid Red 37, 

CAS 6360-07-2 ; Acid Red 40, CAS 12167-45-2 ; Acid Red 106, 
CAS 6844-74-2 ; Acid Red 114, CAS 6459-94-5], les alizarines, 
1'aluminon, razocarmine B [CAS 25360-72-9], la fuschine 
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basique [Basic Red 9, CAS 569-61-9], le Bordeaux R [Acid Red 
17, CAS 5858-33-3], la Carmine [CAS 1390-65-4], 

- soit la EGFP est accepteur d'energie de fluorescence et la substance 
fluorescente est donneur d'6nergie de fluorescence et est choisie parmi des 

5 substances, dont le spectre d'emission chevauche le spectre d'excitation de la 
EGFP, et notamment parmi : les coumarines, la fluorescamine, le 6-(N- 
methylanilino)naphtalene, (mansyl) et leurs derives permettent d'une part le 
greffage et, d'autre part, dont le spectre d'emission recouvre le spectre 
d 'excitation de EGFP, 

10 - ou soit la proteine fluorescente est ECFP et est donneur d'6nergie de 

fluorescence et la substance fluorescente est accepteur d'6nergie et est choisi 
parmi la fluorescelne et le 7-nitrobenz-2-oxa-l,3-diazole, 

- ou soit la proline fluorescente est ECFP et est accepteur d'6nergie de 
fluorescence et la substance fluorescente est donneur d'energie et est choisie 

15 parmi le pyrfcne ou la coumarine ou leurs d6riv6s permettant d'une part le 
greffage, et, d'autre part, dont le spectre d'emission chevauche le spectre 
d'excitation de la ECFP. 

S'agissant de la prot6ine cible, elle peut etre choisie parmi : 

- les r6cepteurs membranaires couples a la prot6ine G, notamment dans 
20 Supplement Trends in Pharmacological Sciences, 1997 (Receptor and ion 

Channel Nomenclature) , 

- les r6cepteurs des facteurs de croissance, notamment ceux qui sont 
structurellement relies au recepteur de Tinsuline (Yarden, Y. and Ullrich, A. 
1988, Biochemistry 22:3113-3119) ou au r6cepteur de l'interferon y (Brisco, J. 

25 et al 1996, Phylos. Trans. R. Soc. Lond. B. Biol. Sci. 351:167-171 ; Ihle, J.N. 
1995, Nature 277:591-594), 

- les recepteurs canaux, notamment dans Supplement Trends in 
Pharmacological Sciences, 1997 (Receptor and ion Channel Nomenclature), 

- les r6cepteurs nucl6aires intracellulaires, notamment ceux qui sont 
30 structurellement reli6s au rdcepteur des steroldes (Mangelsdorf et aL 1995, Cell, 

22:835-839 ; Wurtz, J.L. et al 1996, Nature Struct. Biol. 2:206). 

Selon un mode de realisation avantageux, la proline cible est choisie 
parmi les recepteurs membranaires couples & la proteine G. 

Dans ce qui precede et ce qui suit, on designe par "recepteur" toute 
35 molecule de nature prot6ique susceptible d'entrer en interaction non covalente 
avec un agent pharmacologique. Pr6ferentiellement dans T invention un 
recepteur de neurotransmetteur, d ! hormones, de facteur de croissance etc., 
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capable de produire, aprfes interaction avec un ligand pharmacologique, une 
r6ponse de transduction de signal mesurable in vivo et/6u in vitro. 

Par reponse de transduction de signal, on designe toute reponse, ou 
inhibition de reponse, mesurable in vivo et/ou in vitro, resultant de T interaction 

5 d'un recepteur avec ses agent pharmacologiques specifiques et conduisant a des 
activations, ou inhibitions, du m6tabolisme cellulaire par effet sur des messagers 
secondaires, des enzymes, ou des courants ioniques. 

S'agissant de la reponse de transduction de signal pour les recepteurs 
coupl6s aux proteines G, le test g6n6ral consiste k determiner T activation de la 

10 proteine G par mesure de la fixation de GTP (Befort et al 1996 Neurochem. 
Res. 11:1301-1307). D'autres mesures plus specifiques font par exemple 
intervenir des determinations de concentrations intracellulars d'AMPc, 
d' inositol phosphates, de calcium, des mesures d 1 activation de la transcription 
de genes ou d'activite oncogdnique, suivant le type de couplage sp^cifique du 

15 recepteur considere. 

Pour les recepteurs-canaux, les mesures les plus directes sont des 
determinations de courants ioniques (Hille, B. 1992 in Ion channels of excitable 
membranes, Sinauer Associates, Sunderlands, Massachussets). D ! autres mesures 
peuvent, par exemple, faire intervenir des determination des transcription de 

20 genes ou des activations d' enzymes. 

Pour les recepteurs de facteurs de croissance, les tests gen6raux sont ceux 
de la proliferation, de differentiation ou de la survie cellulaire, frequemment 
aussi des tests de phosphorylations de substrats specifiques (Honneger et al 
1988, EMBO J. 7:3053-3060) de chaque recepteur et reperage par des anticorps 

25 specifiques de phosphoaminoacides. 

Pour les recepteurs nucieaires, les tests de transduction de signal sont ceux 
de la transcription de gfenes dans lesquels des genes rapporteurs 
"chromogeniques" sont places sous le controle de promoteurs specifiques des 
voies de transduction du r6cepteur 6tudie. 

30 A titre d'exemples de r6cepteurs membranaires couples aux proteines G, 

on peut citer les recepteurs de purines et nucleotides, des amines biogeniques 
des peptides et proteines, des eicosanoides, des lip ides et derives, des acides 
amines excitateurs et des ions, des molecules olfactives ainsi que les recepteurs 
orphelins (ci-apres une iiste assez exhaustive). 

35 A titre d 1 exemple de recepteurs de facteurs de croissance, on peut citer les 

cytokines, le facteur de croissance epidermique, Tinsuline, le facteur de 
croissance derive des plaquettes, le facteur de croissance de transformation. 
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A titre de r6cepteurs canaux, on peut citer notamraent les r6cepteurs de 
I'ATP, de la serotonine, du GABA, de la glycine, de 1* acetylcholine, du 
glutamate. 

A titre d'exemple de r6cepteurs nucleaires, on peut citer notamment les 
recepteurs des hormones thyroidiennes, des oestrogenes, des glucocorticoi'des, 
des r6tino'ides. 

A titre de ligands des r6cepteurs couples k la proteine G on peut citer : 

• Purines et Nucleotides 
. Adenosine 

. cAMP 
. ATP 
. UTP 
. ADP 

• Amines Biog6niques (et ligands naturels relies) 
. 5-hydroxytryptamine 

. Acetylcholine 

. Dopamine 

. Adrenaline 

. Histamine 

. Melatonine 

. Noradrenaline 

. Tyramine/Octopamine 

. autres composes relies 

• Peptides 

. Hormone adr6nocorticotrophique (ACTH) 
. Hormone stimulatrice de melanocyte (MSH) 
. Meianocortines 
. Neurotensine (NT) 
.Bomb6sine et peptides voisins 
, Endotheiines 
. Cholecystokinine 
. Gastrine 

. Neurokinine B (NKB) 

. Recepteur des tachykinines 

. Substance K (NKA) 
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. Substance P (SP) 
. Neuropeptide Y (NPY) 
. Facteur de lib6ration de la thyrotropine 
. Nociceptine 
5 . Bradykinine 

. Angiotensine II 
. Beta-endorphine 
. C5a anaphalatoxine 
. Calcitonine 

10 . Chemokines (egalement appelds intercrines) 

. Facteur de lib6ration corticotrophique (CRF) 

. Dynorphine 

. Endorphine 

. Peptides formyles 
15 . Follitropine (FSH) 

. Pheromones de maturation fongique 

. Galanine 

. R6cepteur du polypeptide inhibiteur gastrique (GIP) 

. Peptides analogues du glucagon (GLPs) 
20 . Glucagon 

. Hormone de liberation de gonadotropine (GmRH) 

. Hormone de liberation de T hormone de croissance (GHRM) 

. Hormone diur6tique d'insecte 

. Interleukine 
25 . Leutropine (LH/HCG) 

. MET -enkephaline 

. Peptides opioides 

. Oxytocine 

. Hormone parathyroide (PTH) et (PTHrP) 
30 . Peptides activant l'ad6nyl cyclase pituitaire (PACAP) 

. Secretine 

. Somatostatine 

. Thrombine 

. Thyrotropine (TSH) 
35 . Peptide instestinal vasoactif (VIP) 

. Vasopressine 

. Vasotocine 
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• Eicosanoides 

. IP - Prostacyclines 
. PG - Prostaglandins 
. TX - Thromboxanes 

• Composes a base de r6tinal 
. 11-cis retinal de vert6br6 

. 11-cis retinal d'invertebr6 

• Lipides et compos6s k bases de lipides 
. Cannabinoides 

. Anandamide 

. Acide lysophosphatidique 

. Facteur d l activation des plaquettes 

. Leukotrienes 

• Amino acides excitateurs et ions 
. Ion Calcium 

. Glutamate 

• R6cepteurs orphelins 
. Ricepteurs olfactifs 

Le ligand peut etre soit un agoniste, soit un antagoniste. 

Par "agoniste 11 , on entend toute molecule mimant l'effet du ligand 
endogene naturel, par exemple le neurotransmetteur, le facteur de croissance, 
1* hormone. 

Par "antagoniste", on entend toute. molecule inhibant l'effet de Tagoniste 
en se liant sur la mSme proteine cible que ce dernier. 

L 1 invention concerne un proced6 de detection et de quantification 
d' interactions non covalentes entre une prot6ine cible, notamment un rdcepteur, 
et Tun de ses ligands, caracteris6 en ce que : 

- on prepare des cellules soit des fragments de cellules contenant une 
sequence d'ADN comprenant le gene codant pour une prot6ine fluorescente 
fusionnee avec le g&ne de la prot6ine cible, la fusion entre le gene de la proteine 
fluorescente et le gfene de la susdite proteine cible etant telle que les propriet6s 
de la proteine cible, notamment du recepteur, ne sont pas modifides par la 
presence de la proteine fluorescente, a savoir : 
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* T interaction entre la protfiine cible, notamment le r6cepteur, et le 
ligand n'est pas modifiee, 

* la fonction de transduction de la reponse n'est pas modifiee, la 
proteine fluorescente etant choisie parmi les proteines 

5 fluorescentes issues ou d6riv6es de proteines autofluorescentes de 

cnidaires, dont le coefficient d' extinction moleculaire est 
superieur a environ 14000M* l cm" 1 et le rendement quantique de 
fluorescence est superieur a environ 0,38, notamment choisie 
parmi : 

10 - la proteine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition , deletion ou substitution 
d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propriet6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
15 reserve que ces fragments conservent la propri6te de fluorescence, 

- on met en presence les susdites cellules ou les susdits fragments de 
cellules avec un ligand de la susdite proteine cible, notamment du susdit 
r6cepteur, marque par un marqueur constitu6 : 

- soit par une molecule susceptible d'absorber la lumiere emise par la 
20 proline fluorescente, 

- soit par une substance fluorescente, 

et soit la proteine fluorescente 6tant donneur d f 6nergie de fluorescence et 
le marqueur etant accepteur d'energie de fluorescence, ou soit la proteine 
fluorescente 6tant accepteur d'energie de fluorescence et le marqueur etant une 
25 substance fluorescente donneur d'6nergie de fluorescence, et 

- on irradie k une longueur d'onde permettant soit d' exciter la proteine 
fluorescente, soit d'exciter la substance fluorescente, 

- les susdites 6tapes de mise en presence et d' irradiation pouvant fitre 
effectuees soit simultan&nent, soit Tune apr&s T autre, ou 

30 - on met en presence les susdites cellules ou les susdits fragments de 

cellules avec un ligand de la susdite prot6ine, notamment du susdit recepteur, 
marqu6 par un marqueur, les cellules ou le ligand ay ant ete irradids 
pr^alablement k leur mise en presence, 

- on d6tecte soit une diminution d' amplitude de remission du donneur 
35 et/ou un signal d'emission caract&ristique de remission de Taccepteur. 

. Cellules, fragments et proline puriftee : 
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Par cellule, on entend toute cellule eucaryote ou procaryote, animale ou 
vfgetale dans laquelle on introduit le gfene codant pour une prot6ine de fusion 
entre un recepteur (d6crits) et la GFP ou ses mutants ou fragments. 

Par fragment de cellule, on entend toute fraction, membranaire ou non 
5 membranaire, obtenue a partir des cellules et contenant la proteine de fusion 
recepteur-GFP. 

Par proteine purifi6e, on entend prot6ine de fusion partiellement ou 
totalement purifi6e. 

Selon un mode de realisation avantageux, le proc6d6 utilise l'ADNc du 
10 variant EGFP de la proteine de fluorescence verte fusionnfe a un r6cepteur en 
association avec un ligand dudit recepteur marqu6 par le Bodipy 530-550. Le 
systeme d'expression pr6f6re est la cellule mammifere ou la levure. 

L' invention a 6galement pour objet un proc6d6 de detection et de 
quantification d* interactions non covalentes entre une proteine cible, notamment 
15 un r6cepteur, et Tun de ses ligands, caract6ris6 en ce que : 

- on pr6pare une proline fluorescente fusionn6e avec une proline cible 
dont on veut determiner Interaction proteine-ligand, la fusion entre la proline 
fluorescente et la susdite proteine cible 6tant telle que .les propri6tes de la 
prot6ine, notamment du recepteur, ne sont pas modifiees par la presence de la 

20 proteine fluorescente, k savoir : 

* 1' interaction entre la prot6ine cible, notamment le recepteur, et le 
ligand n'est pas modifiee, 

* la fonction de transduction de la r6ponse n'est pas modifiee, 

la proteine fluorescente etant choisie parmi les protdines fluorescentes issues ou 
25 derivees de proteines autofluorescentes de cnidaires, dont le coefficient 
d' extinction mol6culaire est sup6rieur k environ 14000M" I cm :l et le rendement 
quantique de fluorescence est superieur k environ 0,38, notamment choisie 
parmi : 

- la proline fluorescente verte (GFP), ou 

30 - des variants d6riv6s de la GFP, par addition , d616tion ou substitution 

d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propri6t6 de fluorescence, 

35 - on met en pr6sence la susdite proteine fluorescente fusionn6e avec la 

proteine cible avec un ligand de la susdite proteine, notamment du susdit 
recepteur, ce ligand dtant marque par un marqueur constitu6 : 
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- soit par une molecule susceptible d'absorber la lumiere emise par la 
proteine fluorescente, 

- soit par une substance fluorescente, 

et soit la proteine fluorescente 6tant donneur d'&iergie de fluorescence et 
5 le marqueur etant accepteur d'6nergie de fluorescence, ou soit la proline 
fluorescente 6tant accepteur d'energie de fluorescence et le marqueur est une 
substance fluorescente donneur d'6nergie de fluorescence, et 

- on irradie a une longueur d'onde permettant soit d* exciter la proteine 
fluorescente, soit d'exciter la substance fluorescente, 

10 - les susdites etapes de mise en presence et d' irradiation pouvant Stre 

effectuees soit simuitan6ment, soit Tune aprfes 1'autre, ou 

- on met en presence la susdite proteine fluorescente fusionnee avec la 
proteine cible avec un ligand de la susdite proteine, notamment du susdit 
r6cepteur, ce ligand etant marqu6 par un marqueur constitu6 : 

15 - soit par une molecule susceptible d' absorber la lumiere 6mise par la 

proteine fluorescente, 

- soit par une substance fluorescente, 

la protdine fluorescente fusionn6e avec la proteine cible ou le ligand ayant 
6t6 irradies prSalablement k leur mise en presence, 
20 - on d6tecte soit une diminution d'amplitude de Emission du donneur 

et/ou un signal demission caracteristique d'6mission de l'accepteur. 

La proteine cible et notamment le recepteur modifie par fusion avec la 
GFP devra, outre exhiber la fluorescence de la GFP, conserver des propri6t6s 
pharmacologiques compatibles avec sa definition de recepteur specifique des 
25 composds le caract6risant. En particulier, il devra pouvoir lier les mdme ligands 
que le recepteur sauvage. 

Dans le proc6d6 de l f invention, la mise en presence de la proteine 
fluorescente fusionnde avec la prot6ine cible et du ligand, ou de cellules ou 
fragments de cellules (contenant la susdite proline fluorescente fusionnee avec 
30 la proteine cible) et du ligand conduit & un melange. 

Le mdlange peut etre effectu6 dans n'importe quel ordre d'addition. 
L'ordre pr6f6rentiel sera l 1 addition de ligand fluorescent a une solution de 
cellules ou de proteine, si la GFP est donneur, Tinverse si la GFP est accepteur. 
Le m61ange peut etre effectu6 dans un appareil de m61ange rapide combine 
35 & un systeme de d6tection de fluorescence pour avoir accfes k des mesures en 

temps reel de 1 ! interaction recepteur ligand et de ses alterations par des 
molecules biologiquement actives. 

. Introduction d'ADN dans les cellules ; 
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Les cellules animates, v6g6tales, d'insectes, les levures, les bact6ries ou 
les champignons constituant le systeme d' expression choisi pourront soit etre 
trans fectees, transferases, 61ectroporees, ou infectees, de manifere stable ou 
5 transitoire selon les protocoles d6crits dans les manuels de laboratoire, par 

exemple Current Protocols in Molecular Biology, eds Ausabel et al, John 
Wiley and sons. 

L' invention a 6galement pour objet un procedd dans lequel on introduit 
une etape supplementaire : 
10 - avant ou aprfes, ou simultandment k l ! 6tape de mise en presence de la 

proteine fluorescente fusionnee avec la proteine cible et d'un ligand de la susdite 
proteine, ce ligand 6tant marqufi par un marqueur, ou 

- avant, ou apres, ou simultanfiment h V etape de mise en presence de 
cellules ou de fragments de cellules et d'un ligand de la susdite protdine, marque 

15 par un marqueur , 

cette etape supplementaire consistant : 

- soit a mettre la susdite proteine fluorescente fusionn6e avec la proteine 
cible en pr6sence du susdit ligand non marqu6 et simultan6ment du susdit ligand 
marque, 

20 - soit a mettre en presence les susdites cellules ou les susdits fragments 

de cellules en presence simultan6e du susdit ligand non marqu6 et du susdit 
ligand marqu6, 

- on d6tecte soit une diminution d'amplitude de remission du donneur 
et/ou un signal d'emission caract6ristique de remission de Taccepteur, 

25 respectivement dans le cas de Tutilisation du ligand marqu6 et dans le cas de 
Tutilisation simultande du ligand marqu6 et du ligand non marqu6, 

- et on compare soit les diminutions d ! amplitude de remission du 
donneur respectivement obtenues et/ou les signaux demission caract&istiques 
de remission de l'accepteur respectivement obtenus. 

30 Dans ce cas, il y a comp6tition entre le ligand marqu6 et le ligand non 

marque, vis a vis de la proteine cible. L'int6rfet d'un tel procede est de pouvoir 
6tre adapts sur des automates pour identifier de nouvelles molecules capables 
d'interagir avec la proteine cible et se comportant soit comme agoniste soit 
comme antagoniste vis-k-vis de la reponse biologique. L ! analyse, a diffdrentes 

35 concentrations de la motecule non marqu6e, de Tinhibition de l'interaction entre 
la proline cible et son ligand fluorescent permet par ailleurs de determiner les 
paramfctres d'affinitd de la mol6cule non marquee pour la protdine cible. 
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V invention a 6galement pour objet uii proc6de, dans lequel la proteine 
fluorescente est EGFP et dans lequel : 

- soit la EGFP est donneur d'6nergie de fluorescence et le marqueur est 
accepteur d'6nergie de fluorescence et est choisie parmi des substances, dont le 

5 spectre d 1 excitation chevauche le spectre demission de la EGFP, et notamment 
dans le cas ou le marqueur est une substance fluorescente, il est choisi parmi : le 
4,4-difluoro-4-bora-3a,4a-diaza-s-indacene (Bodipy), Teosine, l'6rythrosine, la 
tetramethylrhodamine, la sulforhodamine 101 commercialisee par Molecular 
probe sous la denomination Texas Red, et leurs d6riv6s permettent d'une part le 
10 greffage et, d' autre part, dont le spectre d' excitation recouvre.le spectre 
d'emission de EGFP, 

et dans le cas oh le marqueur n'est pas une substance fluorescente, 
il est choisi parmi le groupe des acides violets [Acid Violet 5, CAS 
10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ; Acid Violet 17, CAS 
15 4129-84-4], acides rouges [Acid Red 1, CAS 3734-67-6 ; Acid Red 

8, CAS 4787-93-3 ; Acid Red 37, CAS 6360-07-2 ; Acid Red 40, 
CAS 12167-45-2 ; Acid Red 106, CAS 6844-74-2 ; Acid Red 114, 
CAS 6459-94-5], les alizarines, Taluminon, l'azocarmine B [CAS 
25360-72-9], la fuschine basique [Basic Red 9, CAS 569-61-9], le 
20 Bordeaux R [Acid Red 17, CAS 5858-33-3], la Carmine [CAS 

1390-65-4], 

- soit la EGFP est accepteur d'6nergie de fluorescence et la substance 
fluorescente est donneur d'6nergie de fluorescence et est choisie parmi des 
substances, dont le spectre d' Emission chevauche le spectre d' excitation de la 

25 EGFP, et notamment parmi : les coumarines, la fluorescamine, le 6-(N- 
m6thylanilino)naphtalene, (mansyl) et leurs derives permettent d'une part le 
greffage et, d'autre part, dont le spectre demission recouvre le spectre 
d'excitationdeEGFP. 

L' invention a 6galement pour objet un proc6d6 dans lequel la proteine dont 

30 on veut d6terminer l f interaction proteine-ligand est choisie parmi: 

- les r6cepteurs membranaires coup!6s k la prot6ine G, notamment dans 
Supplement Trends in Pharmacological Sciences, 1997 (Receptor and ion 
Channel Nomenclature), 

- les rficepteurs des facteurs de croissance, notamment ceux qui sont 
35 structurellement reliSs au r6cepteur de Tinsuline (Yarden, Y. and Ullrich, A. 

1988, Biochemistry 22:3113-3119) ou au recepteur de Tinterf6ron y (Brisco, J. 
et al. 1996, Phylos. Trans. R. Soc. Lond. B. Biol. Sci. 251:167-171 ; Ihle, J.N. 
1995 , Nature 222:59 1-594) , 
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- les rScepteurs canaux, notamment dans Supplement Trends in 
Pharmacological Sciences, 1997 {Receptor and ion Channel Nomenclature), 

- les recepteurs nucleaires intracellulaires, notamment ceux qui sont 
structurellement relies au r6cepteur des steroi'des (Mangelsdorf et al 1995, Cell, 

5 81:835-839 ; Wurtz, J.L. et al 1996, Nature Struct. Biol. 1:206). 

L* invention a 6galement pour objet un procede dans lequel la proteine 
fluorescente est la EGFP et la substance marqu6e est le Bodipy et dans lequel on 
detecte soit la diminution d'amplitude d'6mission de la EGFP, soit le signal 
d'emission du Bodipy resultant du transfert d'6nergie, la longueur d'onde 
10 d* irradiation correspondant & la longueur d'onde d' excitation de la EGFP. 

L' invention a egalement pour objet un proc6d6 dans lequel la proteine 
fluorescente est la EGFP et la substance marquee est une coumarine et dans 
lequel on d6tecte soit la diminution d'amplitude de la coumarine, soit le signal 
d'6mission de la EGFP resultant du transfert d'6nergie, la longueur d'onde 
15 d' irradiation correspondant a la longueur d'onde d 1 excitation de la coumarine. 

L' invention concerne 6galement un proc6d6 dans lequel la proteine 
fluorescente est ftisionn6e du cot6 N-terminal et la prot6ine cible, notamment le 
r6cepteur, est fusionn6 du cote C-terminal. 

L* invention concerne egalement un procede dans lequel la prot&ne 
20 fluorescente est fiisionn6e du c6t6 C-terminal et la protdine cible, notamment le 
r6cepteur, est fusionn6 du cot6 N-terminal. 

L 1 invention a egalement pour objet un procede dans lequel la proline 
fluorescente est insfiree dans la prot6ine cible a un endroit ne correspondant pas 
a un site de liaison proline cible-ligand, notamment dans le cas des r6cepteurs 
25 couples a la protdine G, cette insertion ay ant lieu dans la premiere ou la 
troisieme boucle intracellulaire du rdcepteur, sous reserve que T insertion ne 
d6truise ni les propri6t6s du r6cepteur, ni la fluorescence de la proline 
fluorescente. 

L f invention concerne egalement un proc6de dans lequel les cellules sont 
30 des cellules de mammiferes, notamment les cellules HEK 293 adh6rentes ou en 
suspension, cellules CHO, cellules COS, lign6es lymphocytaires, fibroblastes, 
etc., ou des cellules de levure, notamment pichia telle que pichia pastoris, 
saccharomyces telle que saccharomyces cerevisia, saccharomyces kluyveri, 
Hansenula telle que hansenula polymorpha, ou des cellules d'insectes infect6es 
35 par un virus tel que baculovirus, notamment cellules TNI ou sf9, ou des 
champignons, notamment les souches de Aspergillus (A. oryzae, A. nidulans, A. 
niger), Neurospora, Fusarium, Trichoderma, 
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L'utilisation de Aspergillus pour l'expression de prolines est decrite dans 
EP 0,272,277 ou EP 0,230,023 ou EP 0,184,438, ou des cellules de plantes, 
notamment Arabidopsis (A. thaliana), ou des protoplastes de citrange (Citrus 
sinensis) est decrite dans Haseloff, J. and Amos, B. 1995, Trends in Genetics 
5 11:328-329. 

S'agissant de la lign6e cellulaire utilisee, elle depend du r6cepteur; il est 
en effet souhaitable de choisir une lignee n'exprimant pas deja de maniere 
naturelle le recepteur choisi. 

L' invention a 6galement pour objet un procede dans lequel un signal est 

0 detectable, dans un appareil de fluorimStrie conventionnel ou dans un appareil 
de m61ange rapide equipe d'un systeme de detection de fluorescence, apres 
melange du donneur et de 1'accepteur et peut etre aboli par 1 'addition d'une 
substance non fluorescente de meme specificite" pharmacologique, et notamment 
dans lequel Ie rapport signal/bruit est sup6rieur a environ 2. 

5 Pour fixer les id6es et a titre d'exemple, le rapport signal/bruit est 

d'environ 100 avec le couple BODIPY-EGFP sur l'equipement utilis6 (decrit 
dans les exemples) et avec le recepteur de la substance qu'on designera par 
NK2R marquee par la EGFP (NK2R-EGFP) et son ligand, la substance K 
(NKA) marqu6e par le BODIPY (NKA-BO). 

D Concernant le signal et le rapport signal sur bruit, il peut etre defini 

comme suit : 

Si le melange du donneur et de 1'accepteur est accompagne d'un 

changement de fluorescence, soit du donneur, soit de 1'accepteur, ce 

changement doit 6tre inhib6 et renversS par une substance non fluorescente (de 
> meme specificity pharmacologique) et qui de plus d6finit la specificit6 du 

ph6nomene pharmacologique observ6. Pour certaines applications (r6ponse de 

type oui-non) un faible rapport signal sur bruit peut suffire. 

S'agissant de la prot6ine cible, il est possible de faire des mesures avec 

des cellules entieres (contenant l'ADN codant pour la proteine cible), des 
) fragments de cellules (membranes pour des r6cepteurs membranaires) des 

echantillons deprot6ines cibles solubilis6s (rdcepteurs membranaires) ou purifies 

(cf. exemples). 

L' invention a 6galement pour objet l'utilisation d'un prot6ine fluorescente 
choisie parmi les proteines fluorescentes issues ou deriv6es de proteines 

1 autofluorescentes de cnidaires, dont le coefficient d' extinction mol6culaire est 
su P 6rieur a environ WOOOM-'cm- 1 et le rendement quantique de fluorescence est 
superieur a environ 0,38, notamment choisie panni : 

- la proteine fluorescente verte (GFP), ou 
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- des variants derives de la GFP, par addition, d616tion ou substitution 
d'un ou plusieurs acides amin6s, sous r6serve que ces variants conservent la 
propri6te de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
5 reserve que ces fragments conservent la propri&6 de fluorescence, 

pour la detection et la quantification d 1 interactions non covalentes entre 
une proline cible constitute par un recepteur couple aux proteines G et une 
prot6ine G, en vue d' identifier les mol6cules biologiquement actives vis-a-vis du 
recepteur, susceptibles de former une interaction non covalente reversible avec 
10 ledit recepteur, ledit r6cepteur 6tant marqu6 par voie g6n£tique par la prot6ine 
fluorescente et la prot6ine G 6tant marqu6e par un marqueur constitue : 

- soit par une molecule susceptible d 1 absorber la lumiere 6mise par la 
proteine fluorescente, 

- soit par une substance fluorescente pouvant 6tre notamment choisie 
15 parmi les protdines fluorescentes issues ou d6riv6es de prot6ines 

autofluorescentes de cnidaires, dont le coefficient d 1 extinction moleculaire est 
superieur k environ WOOOM^cm" 1 et le rendement quantique de fluorescence est 
superieur k environ 0,38, notamment choisie parmi : 

- la proteine fluorescente verte (GFP), ou 

20 - des variants d6riv6s de la GFP, par addition , deletion ou substitution 

d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
r6serve que ces fragments conservent la propri6t6 de fluorescence, 

25 cette detection et quantification ayant lieu par transfert d f 6nergie de 

fluorescence entre le rdcepteur marqu6 par la GFP ou Tun de ses 
variants d6fmis ci-dessus, ou Tun des fragments definis ci-dessus et 
la susdite substance fluorescente, la substance fluorescente 6tant telle 
que soit elle est excitable k la longueur d'onde d Emission de la GFP 

30 ou de Tun des susdits variants, ou de Tun des susdits fragments, soit 

elle 6met k la longueur d 1 excitation de la GFP, ou de Tun des susdits 
variants, ou de Tun des susdits fragments, ou 
. entre la GFP ou Tun de ses variants definis ci-dessus, ou Tun des 
fragments d6finis ci-dessus, et la susdite molecule susceptible 

35 d' absorber la lumiere 6mise par la prbt6ine fluorescente. 

L'invention a 6galement pour objet i'utilisation d'une proteine G marquee 
par un marqueur constitu6: 
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- soit par une molecule susceptible d'absorber la lumiere emise par la 
proteine fluorescente, 

- soit par une substance fluorescente pouvant etre notamment choisie 
parmi les prot6ines fluorescentes issues ou derivfes de proteines 
autofluorescentes de cnidaires, dont le coefficient d* extinction moleculaire est 
superieur a environ MOOOM-'cnV 1 et le rendement quantique de fluorescence est 
superieur a environ 0,38, notamment choisie parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition , d61etion ou substitution 
d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propriete de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
r6serve que ces fragments conservent la propriete de fluorescence, 

pour la d6tection et la quantification d' interactions non covalentes entre 
une proteine cible constituee par un recepteur coupl6 aux proteines G et la 
susdite proteine G, en vue d'identifier les molecules biologiquement actives vis- 
a-vis du r6cepteur, susceptibles de former une interaction non covalente 
reversible avec ledit r6cepteur, ledit recepteur etant marqu6 par voie g6n6tique 
par une proteine fluorescente choisie parmi les prot6ines fluorescentes issues ou 
d6riv6es de proteines autofluorescentes de cnidaires dont le coefficient 
d'extinction moleculaire est sup6rieur a environ 14000M l cm-' et le rendement 
quantique de fluorescence est superieur a environ 0,38, notamment choisie 
parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition, deletion ou substitution 
d'un ou plusieurs acides amin6s, sous reserve que ces variants conservent la 
propriete de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la propriete de fluorescence, 

cette detection et quantification ayant lieu par transfert d'energie de 
fluorescence: 

. entre la GFP ou Tun des variants d6finis ci-dessus, ou l'un des 
fragments definis ci-dessus et la susdite substance fluorescente, la substance 
fluorescente 6tant telle que soit elle est excitable a la longueur d'onde 
d'&nission de la GFP ou de l'un des susdits variants, ou de l'un des susdits 
fragments, soit elle 6met a la longueur d'excitation de la GFP, ou de l'un des 
susdits variants, ou de l'un des susdits fragments, ou 
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. entre la GFP ou Tun de ses variants dSfinis ci-dessus, ou Tun des 
fragments definis ci-dessus, et la susdite molecule susceptible 
d'absorber la lumifcre 6mise par la proline fluorescente. 
Selon un mode de realisation avantageux du proc6de de l' invention, la 
5 proteine fluorescente est choisie parmi EGFP, ECFP, EYFP, ou leurs mutants 
pour lesquels le coefficient d 1 extinction moleculaire est sup6rieur a environ 
14000 M^cin 1 et le rendement quantique est superieur a environ 0,38. 

Selon un mode de realisation avantageux le r6cepteur est choisi parmi : 

- les recepteurs couples aux prolines G, notamment ceux ddcrits dans 
10 Supplement Trends in Pharmacological Sciences, 1997 {Receptor and ion 

Channel Nomenclature), 

- les sequences codant pour des r6cepteurs couples aux prolines G 
putatifs dont les molecules biologiquement actives vis-a-vis d'eux-mfimes sont k 
identifier, notamment choisies parmi les sequences de r6cepteur orphelins 

15 disponibles dans les banques de sequence Genbank, EMBL et banques affixes. 

Selon un autre mode de realisation avantageux, la proteine G est choisie 
parmi les prolines G d6crites dans Journal of Receptor Research, vol 13, ppl9- 
26, 1993 ou Angewandte Chemie, ed. Engl, vol 34, ppl406-1419, 1995. 

L ! invention concerne egalement un proc6d6 de detection et de 

20 quantification d' interactions non covalentes entre une proline cible constitu6e 
par un r^cepteur couple aux prolines G et une proteine G, en vue d* identifier 
les molecules biologiquement actives vis-a-vis du r6cepteur, susceptibles de 
former une interaction non covalente reversible avec ledit r6cepteur r :caract6rise 
en ce que : 

25 - on prepare des cellules soit des fragments de cellules exprimant une 

sequence d'ADN comprenant le gene codant pour une proteine fluorescente 
fusionnee avec le gfene du rdcepteur couple aux prot6ines G, la fusion entre le 
g&ne de la proteine fluorescente et le g£ne du susdit r6cepteur etant telle que les 
propri6t6s du r6cepteur ne sont pas modifies par la presence de la proteine 

30 fluorescente, k savoir : 

* 1' interaction entre le r6cepteur et la proline G n'est pas modifiee, 

* T interaction entre le r6cepteur et la molecule biologiquement active 
n'est pas modifiee, 

* la fonction de transduction de la r6ponse n'est pas modifiee, 

35 la proteine fluorescente etant choisie parmi les prot6ines fluorescentes 

issues ou d6riv6es de protdines autofluorescentes de cnidaires dont le 
coefficient d' extinction mol6culaire est superieur a environ 14000M" 
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^rri" 1 et le rendement quantique de fluorescence est superieur k 
environ 0,38, notamment choisie parmi : 

- la proteine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition , deletion ou substitution 
5 d'un ou plusieurs acides amines, sous reserve que ces variants conservent la 

propriete de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, sous 
reserve que ces fragments conservent la proprietd de fluorescence, 

la prot&ne G 6tant marquee par un marqueur constitu6 : 
10 - soit par une molecule susceptible d' absorber la lumiere emise par la 

proteine fluorescente, 

- soit par une substance fluorescente, 

- la proteine fluorescente et le susdit marqueur 6tant tels qu'ils peuvent 
transferer l'6nergie de Tun k l'autre, la proteine fluorescente pouvant etre 

15 donneur d'6nergie ou le susdit marqueur pouvant etre donneur d'energie, 

T interaction entre le r6cepteur marqu6 par la prot6ine fluorescente et la '■ 
proteine G marqu6e par un marqueur susdefini etant detectee par transfert 
d'energie de fluorescence. 

L ! invention concerne 6galement un proc6de d* identification et 

20 6ventuellement de quantification d ! interactions entre un r6cepteur et une 
molecule non fluorescente biologiquement active vis-i-vis dudit recepteur, 
susceptibles de former une interaction non covalente reversible avec ledit 
recepteur, par mise en oeuvre du proced6 d6fini\ci-dessus, dans lequel une 
molecule non fluorescente biologiquement active est ajout6e a des cellules, ou 

25 fragments de cellules, exprimant l'ADN codant pour le rdcepteur marqu6 par la 
prot6ine fluorescente et pour la prot6ine G marquee par le marqueur, caracteris6 
en ce que : 

- une mol6cule non fluorescente biologiquement active et agoniste 
d6clenche une transduction de signal d6tect6e par variation de transfert d ! energie 

30 entre le recepteur marqu6 par la proteine fluorescente et la prot6ine G marquee 
par le marqueur ; 

- une mol6cule non fluorescente biologiquement active antagoniste inhibe 
la transduction de signal provoqu6e par un agoniste et d6tect6e par variation de 
transfert d'energie de fluorescence entre le r6cepteur marqu6 par la proteine 

35 fluorescente et la proteine G marqu6e par le marqueur. 

. L ! invention a pour objet des cellules ou fragment de cellules contenant une 
sequence d'ADN comprenant le gfene codant pour une prot6ine fluorescente 
fixsionn6e avec le gene d f une proline cible, la proline fluorescente 6tant 
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choisie parmi les proteines fluorescentes issues ou derivees de proteines 
autofluorescentes de cnidaires, dont le coefficient d f extinction moleculaire est 
sup6rieur a environ 14000M l cm" l et le rendement quantique de fluorescence est 
superieur a environ 0,38, la fusion entre le gene de la proteine fluorescente et le 
5 g6ne de la susdite proline cible gtant telle que 

* les proprietes de la proteine cible ne sont pas modifiees par la 
presente de la proteine fluorescente, a savoir 

* r interaction entre la proline cible et le ligand n'est pas modifiee, 

* la fonction de transduction de la reponse n'est pas modiftee, 
10 sous reserve que : 

* lorsque la proteine cible est le r6cepteur des glucocorticoYdes de 
rat fiisionne en N-terminal avec successivement une sequence de 
purification comportant 6 histidines, un Epitope h6maglutinine et 
une proteine fluorescente et est exprimde dans la lign6e cellulaire 

15 1471.1 (Htun et al. 1996, PNAS 22:4845-4850), la proteine 

fluorescente est differente de la GFP (768 paires de bases du 
plasmide TU65 avec la mutation S65T)(Chalfie et al 1994, 
Science 262:802-805, avec la mutation S65T), 

* lorsque la proline cible est le recepteur humain des 
20 glucocorticoides tronqu6 de ses 131 premiers amino acides, 

fiisionne en C-terminal d'une proteine fluorescente dans les sites 
Sal I et BamH I et est exprimSe dans les cellules Cos-1 (Ogawa et 
al 1995, PNAS 22:11899-11903), ladite prot6ine fluorescente est 
differente de la GFP telle que d6crite dans T article de Inouye S. 
25 et Tsuji, F. I. , 1994, Febs Letters, 211:277-280, 

* lorsque la prot6ine cible est la sous-unit6 NMDA Rl de rat 
exprimS dans les cellules HEK 293 (selon Marshall et al 1995, 
Neuron 14:211-215) fusionn6e en C-terminal avec une proteine 
fluorescente, la proline fluorescente est differente de celle 

30 constitufie par les acides amin& 2-238 de la GFP sauvage (Chalfie 

etal 1994, Science 262:802-805), 

* lorsque la proteine cible est un r6cepteur ou un fragment de 
r6cepteur de messagers secondaires intracellulaires, la protdine 
fluorescente est differente de la GFP et de ses d6riv6s 

35 (W096/23898). 

. L 1 invention a 6galement pour objet une trousse ou necessaire pour la 
detection et la quantification d* interactions non covalentes entre une prot6ine 
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cible marqude par une prot6irie fluorescente et Tun de ses ligands marqu6 par un 
marqueur constitu6 : 

- soit par une moldcule susceptible d' absorber la lumiere 6mise par la 
prot6ine fluorescente, 

5 - soit par une substance fluorescente, 

laquelle proline fluorescente est choisie parmi les prolines fluorescentes 
issues ou d6riv6es de proteines autofluorescentes de cnidaires, dont le coefficient 
d'extinction moleculaire est sup6rieur h environ UOOOM^cm* 1 et le rendement 
quantique de fluorescence est superieur k environ 0,38, notamment choisie 
10 parmi : 

- la proline fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition , d616tion ou substitution 
d ! un ou plusieurs acides amines, sous reserve que ces variants conservent la 
propriete de fluorescence, 

15 - ou des fragments de la GFP, ou de fragments des susdits variants, sous 

r6serve que ces fragments conservent la propri6t6 de fluorescence et son ligand 
marque par une substance fluorescente, ladite trousse comprenant : 

- la prot6ine cible fusionude avec une proteine fluorescente ou une lign6e 
celluiaire stable susceptible d'exprimer la proline fusionnde avec une protdine 

20 fluorescente ou un plasmide contenant la s6quence nucldique codant pour ladite 
prot6ine cible fusionnee avec une prot&ne fluorescente telle que ddfinie ci- 
dessus, 

- le ligand marqu6 par le susdit marqueur, 

- Ies tampons et milieux necessaires au transfert d'energie entre la susdite 
25 proteine et le susdit ligand. 

L 1 invention a pour objet une trousse ou n6cessaire pour la detection et la 
quantification d 1 interactions non covalentes entre une prot6ine cible marqu6e par 
une proline fluorescente (n° 1) et Tun de ses ligand marqu6 par une substance 
fluorescente correspondant k une protdine fluorescente (n° 2), la proline 
30 fluorescente (n° 1) 6tant choisie parmi la proline fluorescente EYFP ou EGFP 
et le ligand 6tant marque par la prot6ine fluorescente (n° 2) ECFP ou la proteine 
fluorescente 

(n° 1) etant ECFP et le ligand etant marque par la proteine fluorescente (n° 2) 
EYFP ou EGFP, ladite trousse comprenant : 
35 - soit un plasmide contenant un acide nucl6ique codant pour la proteine 

cible fusionnee avec une prot6ine fluorescente (n° 1), et 

* un plasmide contenant un acide nucl6ique codant pour le ligand 
fiisionne avec une proteine fluorescente (n° 2), ou 
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* un ligand fusionn6 avec une proline fluorescente (n° 2), 
obtenu par voie recombinante et purifi6, 

- soit une lign6e cellulaire stable susceptible d'exprimer la proteine cible 
fusionn6e avec une proteine fluorescente (n° 1), et 

5 * une lign6e cellulaire stable susceptible d'exprimer le ligand 

fusionne avec une proteine fluorescente (n° 2), ou 

* un ligand fusionn6 avec une proteine fluorescente (n° 2), 
obtenu par voie recombinante et purifi6, 

- les tampons et milieux necessaires au transfert d'6nergie entre la susdite 
10 proteine et le susdit ligand. 

L' invention a pour objet une trousse ou nScessaire pour la detection et la 
quantification d' interactions non covalentes entre une proteine cible constitute 
par un r6cepteur coupl6 k la proline G marqu6e par une proteine fluorescente 
(n° 1) et la proteine G marqu6e par une substance fluorescente correspondant h 

15 une prot6ine fluorescente (n° 2), la prot6ine fluorescente (n° 1) 6tant choisie 
parmi la prot6ine fluorescente EYFP ou EGFP et la proteine G 6tant marquee 
par la prot6ine fluorescente (n° 2) ECFP ou la proteine fluorescente (n° 1) 6tant 
ECFP et la proline G 6tant marqu6e par la proline fluorescente (n° 2) EYFP 
ou EGFP, ladite trousse comprenant : 

20 - soit un plasmide contenant un acide nucl6ique codant pour le rtcepteur 

fusionn6 avec une prot6ine fluorescente (n° 1), et 

* un plasmide contenant un acide nucl6ique codant pour la 
prot6ine G fusionn6e avec une proteine fluorescente. (n° 2), ou 

* la proline G fusionnee avec une prot6ine fluorescente 
25 (n° 2), obtenue par voie recombinante et purifiee, 

- soit une lign6e cellulaire stable susceptible d'exprimer le r6cepteur 
fiisionn6 avec une proteine fluorescente (n° 1), et 

* une lignee cellulaire stable susceptible d'exprimer la prot6ine 
G fiisionn6e avec une protdine fluorescente (n° 2), ou 

30 * la prot6ine G fusionnde avec une proteine fluorescente 

(n° 2), obtenue par voie recombinante et purifi6e, 

- les tampons et milieux n6cessaires au transfert d'6nergie entre le susdit 
rtcepteur et la susdite proteine G. 
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DESCRIPTION DETAILLEE DE L 1 INVENTION 

5 Dans sa r6alisation pref6r6e, le dSveloppement de l 1 invention utilise 

l'ADNc codant pour la proline fluorescente verte (Prasher et aL Gene 1992, 
111:229-233; GenBank Accession N° M62653) de la m6duse Aequorea victoria, 
pr6ferentiellement les mutants GFPUV, RSGFP et BFP de cette protdine 
fluorescente optimis6s pour leur expression dans les organismes hotes pr^feres, 

10 les cellules mammiferes. 

L'ADNc peut 6tre modifie pour coder pour un variant dans lequel un ou 
plusieurs acides amines sont substitu6s, insures ou deletds afin de permettre sa 
fusion, en N ou en C-terminai avec le gene codant pour une proline cible. 

La prot6ine cible, pr6f6rentieliement un recepteur, peut etre choisie parmi: 

15 1) les r6cepteurs de neurotransmetteurs couples a des prot6ines G 

structurellement reli6s aux r6cepteurs adr6nergiques et recepteurs 
m6tabotropiques du glutamate tels que presents dans la liste actualis6es 
annuelleraent et 6ditee comme supptement sous le nom: "Receptor and Ion 
Channel Nomenclature" par Elsevier Trends journals, dans Trends in 

20 Pharmacological Sciences. 

2) les r6cepteurs-canaux structurellement relics aux recepteurs 
nicotiniques, au r6cepteurs de glutamate et au r6cepteur de TATP, tels que 
pr6sent6s dans la liste actualis6es annuellement et 6ditee comme supplement sous 
le nom: "Receptor and Ion Channel Nomenclature" par Elsevier Trends journals 

25 dans Trends in Pharmacological Sciences. 

3) les recepteurs nucleaires possedant un domaine d 1 interaction avec 
1'ADN structurellement reli6s au recepteur des st6roides (Mangelsdorf et aL 
1995, Cell, 32:835-839, Wurtz, LL. et aL 1996, Nature Struct. Biol. 2:206). 

4) les recepteurs de la membrane plasmique a activity tyrosine kinase 
30 structurellement reltes au recepteur de Tinsuline (Yarden, Y. and Ullrich, A. 

1988, Biochemistry 22:3113-3119). 

5) les recepteurs membranaires coupl6s aux prot6ines tyrosine kinases 
(STATs, TYK2, Jak) structurellement reli6s au r6cepteur de r interferon y 
(Brisco, J. etal. 1996, Phylos. Trans. R. Soc. Lond. B. Biol. Sci. 251:167-171; 

35 Ihle, J.N. 1995, Nature 2ZZ:59 1-594). 

Dans le cas oil la fusion est effectu6e entre la EGFP et un recepteur coupl6 
aux prolines G (groupe 1), la fusion peut 6tre notamment effectu6e: 
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1) du cote N-terminal du recepteur, et done du cote C-terminal de la 
EGFP, 

2) du cot£ C-terminal du recepteur et done du cote N-terminal de la 
EGFP, 

5 3) dans la: sequence du recepteur, en particulier dans la premiere ou la 

troisieme boucle intracellulaire, 6ventuellement en introduisant une ou plusieurs 
copies d'une sequence espaceur, notamment -GGGGS-. 

Dans le cas ou la fusion est effectu6e entre la EGFP et un recepteur-canal 
(groupe 2), la fusion peut etre notamment effectu6e: 
10 1) dans la region homologue k la "region immunogenique majeure" de la 

sous-unite a du recepteur nicotinique de Torpille (r6sidus 67-76), 
eventuellement en introduisant une ou plusieurs copies d'une sequence espaceur, 
notamment -GGGGS-. 

Dans le cas ou la fusion est effectuee entre la EGFP et un recepteur 
15 nucI6aire (groupe 3), la fusion peut etre notamment effectu6e: 

1) du cot6 N-terminal du r6cepteur, et done du cote C-terminal de la 
EGFP, 

2) du cote N-terminal du r6cepteur, tronqu6 dans sa partie N-terminale 
en amont du domaine de liaison a l'ADN, et done du cote C-terminal de la 

20 EGFP. 

Dans le cas ou la fusion est effectuee entre la EGFP et un recepteur soit k 
activite tyrosine kinase, soit couple k une tyrosine kinase (groupes 4 et 5), la 
fusion peut 6tre notamment effectuee: 

1) du cote N-terminal du r6cepteur, et done du cote C-terminal de la 
25 EGFP, 

Tout gene codant pour une proteine fluorescente, notamment la GFP, 
couplde a un r6cepteur, et derivant d'organismes exprimant la GFP ou des 
prot6ines similaires pourraient 6tre utilises dans cette invention. 

Les sequences d'ADN codant pour la GFP et les proteines cibles, 
30 notamment des recepteurs, peuvent etre d ! origine genomique ou etre des ADNc, 
et peuvent 6tre obtenus k partir de l'ADN de n'importe quelle espece animale ou 
vegetale, eucaryote ou procaryote, par exemple en preparant des banques 
g6nomiques ou des banques d'ADNc et en criblant ces banques pour identifier 
les sequences codantes par hybridation avec des sondes oligonucieotidiques par 
35 les techniques standard (Current Protocols in Molecular Biology, op. cit.). 

Les constructions d'ADN codant pour la GFP et les proteines cibles 
peuvent aussi Stre obtenues par synthase totale par les methodes standards, 
notamment la m6thode des phosphoramidites (Beaucage and caruthers, Tett. 
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Lett. 1981, 22:1859-1869)' et 1'emploi d'appareils de synthase d'ADN 
automatises, le polynucleotide obtenus 6tant ensuite purifies, ligu6s et clones 
dans les vecteurs appropri6s. Pour la plupart des applications, les gfcnes codant 
pour la GFP et les proteines cibles seront pr6ferentiellement obtenus par 
5 criblage de banques, tandis que les bras espaceurs ainsi que les oligonucleotides 
requis pour la mutagenese seront pr6f6rentiellement obtenus par synthese. 

Les constructions d'ADN pourront etre de nature mixte, synthetique et 
genomique, par ligation de fragments synthetiques avec des element d'ADN 
g6nomique, selon des procedures standard (Current Protocols in Molecular 
10 Biology, op.cit.). 

Les constructions d'ADN peuvent aussi etre obtenues par PCR 
(polymerase chain reaction) en employ ant des amorces specifiques, comme par 
exemple d6crit dans PCR protocol 1990, Academic press, San Diego, 
California, USA. 

15 Enfin, les constructions d'ADN peuvent etre modifies par d'autres 

m6thodes incluant par exemple des reactions chimiques, de la mutagenese . 
aleatoire ou dirig6e, par insertion, deletion ou substitution de nucleotides, ces 
modifications pouvant alterer des propriet6s de Tune ou l'autre proteine, 
notamment, la GFP et les proteines cibles. 

20 Les constructions d'ADN peuvent etre inser6es dans un vecteur 

recombinant. Ce vecteur peut etre n ! importe quel vecteur approprie pour les 
procedures employees avec des vecteurs recombinants. Le choix du vecteur sera 
souvent effectu6 en fonction de la cellules h6te dans laquelle a construction 
d'ADN voudra etre introduite. Le vecteur pourra ainsi etre un vecteur capable 

25 de se repliquer de maniere autonome, c'est-i-dire extrachromosomal, et 
ind6pendante de la replication chromosomale, par exemple un plasmide. 
Alternativement, le vecteur pourra etre eiabore de maniere a integrer tout ou 
partie de l'ADN qu f il contient dans le genome de la cellules hdte, et se 
r6pliquera en mSme temps que le(s) chromosome(s) dans lequel il sera integre. 

30 Le vecteur est pr6f6rentiellement un vecteur d' expression dans lequel la 

GFP fusionnee k la proteine cible ou la GFP fiisionnee au ligand est sous le 
contrdle d'autres segments d'ADN requis pour la transcription. En general, le 
vecteur d'expression derive d'ADN plasmidique ou viral ou peut contenir des 
elements de l'un et de V autre. 

35 Le terme "sous le contrdle" indique que les segments d'ADN sont 

disposes sur le vecteur de maniere k fonctionner de concert pour servir l'objectif 
voulu, par exemple, la transcription est initiee dans le promoteur et se poursuit 
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tout au long de la sequence codant pour la proteine cible fusionn6e k la GFP ou 
le ligand fusionn6 a la GFP. 

Le promoteur peut fetre n'importe quelle sequence d'ADN susceptible de 
promouvoir une activity transcriptionnelle dans la cellule hote choisie et peut 
5 6tre deriv6 de gene homologues ou h6t6rologues k la cellule hote. 

Des exemples du promoteurs convenant pour 1 ! expression de la proline 
cible fusionnee avec le GFP ou du ligand fusionn6 avec la GFP dans des cellules 
mammiferes sont le promoteur du virus simien SV40 (Subramani et al. 1981, 
Mol Cell. Biol. 1:854-864), le promoteur du virus du sarcome de Rous (RSV), 
10 le promoteur du cytomegalovirus (CMV) ou le promoteur tardif majeur de 
l'adenovirus (AdMLP). 



Exemples de promoteurs pour cellules d'insectes : 

Promoteur de la polyh6drine (US 4,745,051; Vasuvedan et al. 1992, 
15 FEBS Lett. 311:7-11) le promoteur P10 (Vlack et al 1988, J. Gen. Virol. 
62:765-776) le promoteur du gfcne precoce 1 du baculovirus (US 5,155,037; US 
5,162,222). 

Exemples de promoteurs pour levures : 
20 Promoteurs des gfenes de la glycolyse (Hitzeman et al. J. Biol. Chem. 

1980, 255:12073-12080; Alber et Kawasaki, J. Mol. Appl. Gen. 1982, 1:419- 
434) des genes des alcool deshydrog&iases (Young et al dans Genetic 
Engineering of microorganisms for chemicals (Hollaender et al eds), Plenum 
Press, NY 1982). 

25 

Exemples de promoteurs pour bact6ries: 

Des exemples de promoteurs pour 1'expression dans la bact6rie peuvent 
6tre des promoteurs constitutifs comme le promoteur de la polymerase T7, ou 
des promoteurs inductibles cornme par exemple le promoteur pL du phage 
30 lambda (Current Protocols in Molecular Biology, op.cit.). 

Exemples de promoteurs pour champignons filamenteux 
Les promoteurs utilisables sont par exemple le promoteur ADH3 
(McKnight et al EMBO J. 1985, 4:2093-2099) ou le promoteur tpiA. D f autres 
35 promoteurs utiles peuvent etre d6rives des gfenes codant pour l 1 aspartate 
proteinase de Rhizomucor miehei, Talpha-amylase neutre de Aspergillus niger, 
de Tac6tamidase de Aspergillus nidulans, de la TAKA amylase de Aspergillus 
oryzae ou le promoteur de la glucoamylase de Aspergillus awamori. 
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Le vecteur pourra par ailleurs contenir : 

- des sequences de polyad&iylation, comme par exemple celles de SV40 
ou de la region Elb 5 de l'ad6novirus, 

- des sequences activatrices (enhancer) de la transcription (1'activateur de 
SV40), 

- des sequences de replication comme par exemple les sequences de 
replication de SV40 ou du virus Epstein Barr, pour les cellules mammiferes ou 
1'origine et les genes de replication REP 1-3 du plasmide 2 jt, pour les levures, 

- des marqueurs de selection, a savoir des genes conferant une resistance 
a un antibiotique (neomycine, zeocine, hygromycine, ampicilline, kanamycine, 
tetracycline, chloramphenicol...) ou permettant la compensation d'un defaut 
(gene codant pour la dihydrofolate reductase permettant la resistance au 
methotrexate, ou gene TPI de S. pombe decrit par Russell, 1985, Gene, 4Q:125- 
130). 

La cellule hdte peut fetre n'importe quelle cellule capable d'exprimer la 
construction d' ADN inseree dans un vecteur approprie. 

Les cellules peuvent £tre notamment des bacteries, des levures, des 
champignons et des cellules eucaryotes superieures comme par exemple des 
cellules mammiferes. 

Des exemples de cellules bacteriennes capables d'exprimer les 
constructions d 1 ADN sont : 

- des bacteries grampositives telles que les souches de Bacillus comme B. 
subtilis, B. licheniformis, B. lentus, B. brevis, B. strearothermophilus, B. 
thurigiensis ou des souches de Streptomyces comme S. lividans, S murinus, 

- des bacteries gramnegatives telles Escherichia coli. 

La transformation des bacteries peut 6tre effectuee par transformation 
protoplastique ou par transformation de bacteries competentes (Current 
Protocols in Molecular Biology, op.cit.). 

Exemples de cellules eucaryotes: 

Lignees cellulaires HEK 293, HeLa, cultures primaires, cellules COS 
(e.g. ATCC CRL 1650), BHK (e.g. ATCC CRL 1632) CHO (e.g. ATCC CCL 
61). 

Les m6thodes d' introduction de l'ADN dans ces cellules (transfection, 
lipofection, eiectroporation etc. sont decrites dans Current Protocols in 
Molecular Biology, op.cit. 
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Exemples de cellules de levures : 

Saccharomyces, S. cerevisiae, S. kluyveri, 

Kluiveromyces, K. lactis, 

Hansenula, H. polymorpha, 
5 Pichia, P. pastoris, 

transferases par introduction d'ADN het6rologue selon les protocoles demerits 
dans Current Protocols in Molecular Biology, op.cit. 

Les cellules transferases sont s61ectionn6es par un ph6notype d6termin6 
par un marqueur de resistance, g6n6ralement & une drogue, ou par Ieur capacity 
10 a proliferer en T absence d'un nutriment particulier. 

Exemples de champignons filamenteux: 

Les souches Aspergillus (A. oryzae, A. nidulans, A. niger), Neurospora, 
Fusarium, Trichoderma. L'utilisation de Aspergillus pour 1'expression de 
15 prolines est decrite dans EP 272 277 ou EP 230 023 ou EP 184 438. 

Exemples de cellules d ! insectes : 

On peut citer les lign6es de Lepidoptera e.g. Spodoptera frugiperda (Sf9) 
ou Trichoplusia ni (Tni). Les m6thbdes de transformation (infection en 
20 particulier) sont d6crites dans Current Protocols in Molecular Biology (op.cit.). 

LES LIGANDS 

Les ligands interagissant avec la prot6ine cible peuvent etre de n'importe 
quelle origine (natureile, synth6tique, semi-synth6tique, recombinante), et de 

25 n'importe quelle structure (chimique, peptidique, prot&que). Us peuvent etre 
naturellement fluorescents (ou porteurs d'un chromophore) ou peuvent 
n6cessiter soit une rdaction chimique permettant le greffage d'un groupe 
fluorescent (ou d'un pr6curseur de groupe fluorescent) ou d'un chromophore, 
soit une construction d'ADN conduisant k la fusion du ligand avec la GFP et 

30 permettant V expression du ligand ainsi rendu fluorescent. 

Des exemples de reactions chimiques sont: 

- couplage d' amines ou de thiols avec des r6actifs de type halog6nure 
d'alkyle, halogdnures d'aryles, halogenures d'acyles, halogenures decides, le 

35 groupe isothiocyanate, le groupe mal6imide, les 6poxydes, dans un solvant 
organique en presence d'une base ou en milieu aqueux, 

- couplage decides avec des amines activ6es par des groupes tels que les 
succinimides. 
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Selon le.proc6d£ de I' invention, la fluorescence des cellules transformees 
peut etre mesuree dans un spectrofluorimetre a l'aide duquel les propri6t6s 
spectrales des cellules, en suspension ou adh6rentes, peuvent etre determines 
par l'acquisition de leurs spectres d'excitation et d'6mission. Les interactions 
avec le ligand fluorescent sont ensuite detectees par les changements des 
spectres d'excitation et/ou d'emission du donneur et de l'accepteur d'6nergie, et 
les ligands sont d6finis comme pharmacologiquement significatifs si leurs 
interactions avec la prot6ine cible sont inhibges par 1' addition d'un exces de 
ligand non fluorescent empechant 1' interaction entre la proteine cible 
fluorescente et le ligand fluorescent. 

DESCRIPTION DES FIGURES : 

- La Figure 1 donne la sequence nucl6otidique codante de la GFP 
sauvage (Prasher et al. 1992, Gene 111:229-233) de Aequorea victoria. 

- La Figure 2 represente la fluorescence mesuree Iors de 1 'expression de 
la construction pMT3-EGFP-C3-SP. En ordonn6e, on a presente la fluorescence 
exprimde en coups par seconde (cps) et en abscisse la longueur d'onde 
d'6mission. La trace representee est un spectre d'emission de difference entre la 
mesure du milieu de culture exprimant la EGFP et le milieu de culture 
n' exprimant pas la EGFP. 

- La Figure 3 represente la construction d'ADN pCEP4-NK2R-RFl 
(13,67 kb) et comporte les sequence codant pour le peptide signal du r6cepteur 
nicotinique alpha7 (alpha7 SP), la EGFP (EGFP C3-1) et le rdcepteur NK2R 
(NK2R ARNm) des tachykinines. 

- La Figure 4a repr6sente les spectres d'excitation (6mission 540 nm) et 
d' 6mission (excitation 450 nm) de cellules HEK293 en suspension exprimant les 
constructions d'ADN pCEP4-NK2R et pCEP4-NK2R-RFl. En ordonnee, on a 
pr6sent6 la fluorescence exprimee en coups par seconde (cps) et en abscisse la 
longueur d'onde d'6mission. 

Les courbes en pointiltes repr6sentent les spectres d'excitation (emission 
540 nm) de pCEP4-NK2R (traits fins) et pCEP4-NK2R-RFl (traits gras). 

Les courbes en trait plein repr6sentent les spectres d'emission (excitation 
450 nm) de pCEP4-NK2R (traits fins) et pCEP4-NK2R-RFl (traits gras). 
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- La Figure 4b represente le spectre demission (excitation 450 nm) de 
cellules exprimant les r6cepteurs NK2R-WT (courbe n° 3), NK2R-RF1 (courbe 
n° 1) et NK2R-RF2 (courbe n° 2). En ordonnee, on a pr6sent6 la fluorescence 

5 exprim6e en coups par seconde (cps) et en abscisse la longueur d'onde 
d'emission. 

- La Figure 5a represente la liaison de l'antagoniste 3 H SR 48968 sur des 
cellules exprimant le recepteur NK2R sauvage. En ordonnee, on a represente la 

10 quantite de 3 H SR 48968 li6e (en disintegrations par minute;dpm) et en 
abscisse, la concentration de 3 H SR 48968 ajoutee dans l'6chantillon. Les 
losanges gris et noirs representent la liaison totale de 3 H SR 48968 dans deux 
experiences differentes, les croix et carres gris represented la liaison non 
speciflque d6termin6e en presence d'un exces de neurokinine A (10 ^M). Les 

15 lignes correspondent aux courbes theoriques de liaison d'un ligand a son 
r6cepteur ou a des sites de liaison non sp6cifiques. Les valeurs d'affinite 
d6termin6es (KD) sont de 1.05 nM et 0.78 nM dans chacune des deux 
experiences. Les valeurs de liaison maximale (B max) sont toutes deux 
de 0.1 pMol/25000 cellules. 

-20 

- La Figure 5b repr6sente la liaison de l'antagoniste 3 H SR 48968 sur des 
cellules exprimant le recepteur fluorescent NK2R-RF1. En ordonnee, on a 
repr6sent6 la quantite de 3 H SR 48968 liee (en d6sint6grations par minute;dpm) 
et en abscisse, la concentration de 3 H SR 48968 ajoutee dans l'6chantillon. Les 

25 losanges gris et noirs representent la liaison totale de 3 H SR 48968 dans deux 
experiences differentes, les croix et carres gris representent la liaison non 
speciflque determinee en presence d'un exces de neurokinine A (10 /xM). Les 
lignes correspondent aux courbes theoriques de liaison d'un ligand a son 
recepteur ou a des sites de liaison non specifiques. Les valeurs d'affinite 

30 determinees (KD) sont de 0.8 nM et 0.92 nM dans chacune des deux 
experiences. Les valeurs de liaison maximale (B max) sont respectivement de 
0.075 et 0.088 pMol/25000 cellules. 

- La Figure 6a repr6sente le test de fonctionalite de reponse de liberation 
35 de calcium intracellulaire (FURA 2) de cellules exprimant la construction 

d'ADN pCEP4-NK2R WT. En ordonnee, on a represente la fluorescence a 510 
nm (exprim6e en coups par seconde), l'excitation ayant lieu a 340 nm et en 
abscisse, on a repr6sente le temps (seconde). Les r6ponses sont 6voquees par 
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1'agoniste neurokinine A (NKA) et inhibees par l'antagoniste cyclo(-Gln-Trp- 
Phe-Gly-Leu-Met) (cyclopeptide) . Dans l'experience 1, on ajoute 10 nM de 
NKA. Dans l'experience (2,3), on ajoute successivement 5 fiM de cyclopeptide 
(2), puis 10 nM de NKA (3). 

- La Figure 6b represente le test de fonctionnalite de reponse de 
liberation de calcium intracellulaire (FURA 2) de cellules exprimant la 
construction d'ADN pCEP4-NK2R-RFl. En ordonn6e, on a represente la 
fluorescence a 510 nm (exprimee en coups par seconde), l'excitation ayant lieu a 
340 nm et en abscisse on a represente le temps (seconde). Les reponses sont 
6voquees par 1'agoniste neurokinine A (NKA) et inhib6es par l'antagoniste 
cyclo(-Gln-Trp-Phe-Gly-Leu-Met) (cyclopeptide). Dans l'experience 1, on 
ajoute 10 nM de NKA. Dans l'experience (2,3), on ajoute successivement 5 pM 
de cyclopeptide (2), puis 10 nM de NKA (3). 

- La Figure 7 represente la purification du peptide NKA BO I par HPLC 
en phase inverse. En abscisse, on a represents le temps (minute) et en ordonn6e 
la density optique (mV). La detection est effectuee a 2 longueurs d'onde : 219 
nm (traits pointings) et 530 nm (traits pleins). 

Les pics identiques 1, 2 et 3 sont respectivement la NKA, le derive NKA- 
BODIPY, le reactif BODIPY-IA . 

- La Figure 8a represente le deplacement de la liaison de 3 H SR48968 
sur le rficepteur NK2R-WT par NKA et NKA BO 1. En ordonn6e, on a 
repr6sente la radioactivite (exprimee en d6sint6grations par minute;dpm) et en 
abscisse la concentration en Iigand (M). 

Les cercles noirs repr6sentent l'experience de deplacement de 
3 H SR48968 par la NKA-BO I (KI = 16,15 nM). 

Les carr6s blancs representent l'experience de deplacement de 
3 H SR48968 par la NKA (KI = 3,03 nM). 

- La Figure 8b repr6sente le deplacement de la liaison de 3 H SR48968 
sur le recepteur NK2R-RF1 par NKA (ronds noirs : (KI = 2, 1 nM) et NKA-BO 
I (carres blancs : (KI = 16,08 nM). En ordonnee, on a represente la 
radioactivite (exprimee en disintegrations par rninutejdpm) et en abscisse la 
concentration en ligand. 
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- La Figure 9 reprSsente l'experience de transfert d'6nergie entre le 
ligand fluorescent NKA-BO I et le recepteur fluorescent NK2R-RF1 determinee 
a l'Squilibre. 

La courbe en trait plein reprSsente Emission de fluorescence (entre 490 et 
5 600 nm) des cellules exprimant le recepteur fluorescent NK2R-RF1 (excitation 
460 nm) (Etape 1). 

La courbe en grands traits pointilles reprSsente le meme spectre 
d' emission de fluorescence apres addition de 100 nM de NKA BO I (Etape 2). 
La courbe en traits pointings represente le spectre demission de 
10 fluorescence apres addition, sur l'Stape 2, de 10 fiM de NKA non fhiorescente. 
Les memes rSsultats sont obtenus apres addition de 10 fM de cyclo(-Gln-Trp- 
Phe-Gly-Leu-Met) ou de SR 48968. 

L'addition, en Stape 2, de NKA non fluorescente au lieu de NKA BO I est 
sans effet sur le spectre d Emission de fluorescence. Celui-ci se superpose avec 
15 le spectre en trait plein. 

En ordonnSe, on a reprSsentS la fluorescence en cps, en abscisse la 
longueur d'onde en nm. 



- La Figure 10 reprSsente la mesure en temps reel du transfert d'energie 
entre 100 nM de NKA BO 1 et le recepteur NK2R-RF1 (1), et inhibition (2) par 
un exces de ligand non fluorescent (20 /*M de NKA ou de MEN 10,376 ou de 
cyclopeptide). En abscisse, on a represents le temps en seconde et en ordonnee 
la fluorescence (coups par seconde) a 510 nm, r excitation ayant lieu a 460 nm. 

La mesure est effectuSe avec une suspension de 10^ cellules/ml. 

- La Figure 1 la reprSsente la mesure en temps r6el du transfert d'energie 
entre 100 nM de NKA-TR et le recepteur NK2R-RF1 (1), et inhibition par un 
exces (2) de ligand non fluorescent (100 /iM de NKA ou de MEN 10,376 ou de 
cyclopeptide). En abscisse, on a represents le temps en seconde et en ordonnee 
la fluorescence (coups par seconde) a 510 nm, l'excitation ayant lieu a 460 nm. 

- La Figure lib reprSsente la mesure en temps reel du transfert d'Snergie 
entre 100 nM de NKA-Eos et le recepteur NK2R-RF1 (1), et inhibition par un 
exces (2) de ligand non fluorescent (20 fM de NKA ou de MEN 10,376 ou de 
cyclopeptide). En abscisse, on a represents le temps en seconde et en ordonnSe 
la fluorescence (coups par seconde) a 510 nm, l'excitation ayant lieu a 
470 nm. 
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- La Figure 12 represente 1 'amplitude du signal de fluorescence en 
fonction de la concentration de NKA BO I ajoutee (0 a 256 nM) a une 
suspension de cellules (10$ cellules/ml) exprimant le recepteur NK2R-RF1 et 
l'inhibition par un exces (A) de Iigand non fluorescent (10 pM de NK ou de 
MEN 10,376 ou de cyclopeptide). En abscisse, on a represente le temps en 
seconde et en ordonnee la fluorescence (coups par seconde) a 510 nm, 
1'excitation ayant lieu a 450 nm. 

- La Figure 13 represente le traitement des donn6es de la Figure 12. En 
abscisse, on a represente la concentration en NKA BO I (nM) et en ordonnee 
l'amplitude du signal de fluorescence exprimee en unites arbitraires (U.A.). La 
ligne en trait plein represente la courbe theorique de liaison de la NKA-BO I a 
ses sites et fournit une valeur d'affinit6 KD = 24 nM. 

- La Figure 14 represents I'extinction de fluorescence mesuree a 510 nm 
(excitation a 460 nm) resultant de la liaison de 10 nM NKA-Bo sur le rdcepteur 
EGFP-NK2R exprime a la surface de cellules HEK 293 (suspension a 10 6 
cellules/ml) en absence, et en presence de concentrations croissantes (indiquees 
sur le graphe en nM) de neurokinine A (NKA). En ordonnee, on represente la 
fluorescence mesuree en coups par seconde (cps) et en abscisse, le temps en 
seconde. 

- La Figure 15 correspond a 1'experience decrite dans la figure 14, 
effectuee en presence de neurokinine A (NKA) ou de SR48968. L'amplitude de 
fluorescence, normalisee par rapport a l'amplitude de fluorescence mesuree en 
absence de NKA ou SR48968, est reportee sur un graphe en fonction de la 
concentration de NKA ou SR48968 utilisee pour tracer une courbe de 
competition pour la liaison de NKA-Bo contre la NKA ou le SR48968 sur le 
recepteur EGFP-NK2R. L'affinite du ligand non fluorescent est determine a la 
valeur d'inhibition de 50 % de la liaison de NKA-Bo qui correspond a l'IC 50 du 
compost non fluorescent. 

- La Figure 16 represente le spectre demission de cellules (a 10 6 
cellules/ml) exprimant la proline de fusion EGFP-Hind-CCR5 . L'excitation est 
fix6e a 460 nm. En ordonnees, on represente la fluorescence exprimee en coups 
par seconde (cps) et en abscisse, la longueur d'onde d'emission en nm. 
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- La Figure 17 represente un test de fonctionnalite de reponse de 
liberation de calcium intracellular (INDO-1) de cellules exprimant la 
construction d'AND EGFP-Hind-CCR5 . En ordonn6e, on a repr6sent6 la 
fluorescence a 405 nm exprimee en coups par seconde, 1'excitation ayant lieu k 

5 335 nm, et en abscisse, on a repr6sente le temps en seconde. La reponse 
6voquee par 100 nM de la chimiokine RANTES est montree. 

- La Figure 18 repr6sente la revelation de 1' expression de la chimiokine 
fluorescente EGFP-RANTES par immunoblot a 1'aide d'un anticorps anti-GFP. 

10 Les levures, ou leurs surnageants de culture, exprimant une proteine non 
fluorescente (le trypsinogene) ou la construction d'ADN codant pour EGFP- 
RANTES sont d£pos6s sur gel d6naturant de polyacrylamide 12 %. Apres 
61ectrophorese, les prolines sont electrotransfer6es sur membrane de 
nitrocellulose et la presence de prot6ines comprenant la GFP est rev61ee par 

15 addition d' anticorps primaire anti-GFP de lapin puis d' anticorps secondaire anti- 
lapin couple a la luciferase. Les bandes proteiques contenant la GFP sont 
r6v616es par chimioluminescence k Taide du Kit ECL disponible chez 
Amersham. 

La figure r6vfele la presence de EGFP-RANTES dans les pistes 3 et 6 
20 (respectivement surnageant de culture de levures, et levures) exprimant la 
construction d^DN-EGFP-RANTES (bande de 42 000 daltons). Les pistes 1 et 
8 correspondent k la migration de marqueurs de poids moleculaires annot^s 20, 
30, 40 et 50 kilodaltons. La piste 2 correspond au surnageant de levures 
contrdle (trypsinogene), la piste 4 correspond au precipit6 de dialyse de EGFP- 
25 RANTES, la piste 5 correspond k la levure contrdle et la piste 7 correspond k la 
levure exprimant EGFP seule. 

EXEMPLES 

30 EXEMPLE 1 : CONSTRUCTIONS D'ADN COMPRENANT UNE 

FUSION ENTRE LA EGFP ET L'EXTREMITE AMINO TERMINALS DU 
RECEPTEUR NK2R DES TACHYKININES 

I) Fusion de la EGFP avec un peptide signal : 
35 L'ADNc codant pour le EGFP (Figure 1) est fusionn6 en phase avec la 

sequence codant pour le peptide signal de la sous-unit6 alpha 7 de poulet 
(Genbank accession N°: X522995) codant pour un rdcepteur nicotinique de 
T acetylcholine comme suit: 

On introduit sur les codons codant 1 k 9 de la EGFP un site de restriction 
40 pour Tendonucl6ase BsrG I a l'aide de 1' oligonucleotide 
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5'GGTCGCCACCCTGTACAAGAAGGGCGAGG3 ' , des reactifs fournis dans 
le kit de mutagenese RPN 1526 (Sculptor) fourni par la societe Amersham, et de 
simple brin de pEGFP C3 prdpard a partir du plasmide pEFGP C3 (Genbank 
Accession N° U57607) fourni par la societe ClonTech. le mutant pEGFP C3-1 
obtenu est sequence, puis clon6 en phase avec le peptide signal de alpha7 par 
ligation de deux fragments: le fragment BsrGI-Xho I de 5225 nt de pJL223 
(Eisele et al. 1993, Nature 266:479-483) et le fragment BsrG I - Xho I de 725 
nt de pEGFP C3-1. Le plasmide pJL223 contient le gene de la proteine a7- 
V201-5HT3 entre les sites Not I et Xho I du vecteur pMT3 (Swick, A.G. et al. 
1992, Proc. Natl. Acad. Sci. 22:1812-1816). la construction obtenue nomm6e 
pMT3-EGFP-C3-SP, est transitoirement exprimee dans des cellules HEK 293 
(ATCC CRL 1573) apres transfection au phosphate de calcium (Cheng et 
Okayama 1986), afin de verifier que la construction est correcte. Le spectre 
d'emission de fluorescence (excitation 450 nm) des surnageants de culture de 
cellules exprimant pMT3-EGFP C3-SP ou de cellules non transfect6es 
(concentres 5 fois par centrifugation sur centrikon 10 (Amicon)) sont 
enregistr6s. Sur la figure 2 qui montre la difference entre le spectre de cellules 
transfectees et non transfectees, on d6tecte nettement le pic d'6mission de la 
EGFP, ce qui indique que la construction conduit effectivement a l'expression 
de EGFP secretee dans le milieu de culture. 

II) Clonage du recepteur NK2R des tachykinines dans les vecteurs de 
mutagenese KS et d'expression pCEP4 : 

Le fragment Spe I - Hind HI, 2997 nt, du plasmide prTKRl-1 (Pr. S. 
Nakanishi, Kyoto university, Japon, Biochem. Biophys. Res. Comm. 1989, 
16^:695-702), contenant l'ADNc codant pour le recepteur NK2R (Genbank 
accession N°: M31838) de rat, est ligue avec le fragment Spe I - Hind III, 
3549 nt, du vecteur pBluescript KS (+) pour conduire au plasmide pKS NK2R. 

Le fragment Not I - BsrG I, 1369 nt, du plasmide prTKRl-1 est ligue avec 
le fragment BsrG I - Xho I, 1663 nt, de pKS NK2R et le fragment Not I - Xhol, 
10370 nt de pCEP4 pour conduire au plasmide pCEP4-NK2R. 

III) Fusion de la EGFP entre le peptide signal de alpha7 et l'extr6mue 
amino terminal du recepteur NK2R des tachykinines : 

Le fragment Not I - Xho I, 816 nt, de pMT3-EGFP C3-SP est ligud avec 
le fragment Not I Xho I (digestion partielle Xho I), 12856 nt, de pCEP4-NK2R 
pour conduire a la construction pCEP4-NK2R-RFl (figure 3). 
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EXEMPL5 2 : CONSTRUCTION D'ADN COMPRENANT LA FUSION 
DE LA GFP DANS LES BOUCLES INTRACELLULARS II ET 13 DU 
RECEPTEUR NK2R DES TACHYKININES 

5 I) Introduction de sites de clonage de la EGFP dans la boucle il ou i3 du 

recepteur NK2R : 

L'ADN simple brin de pKS NK2R est mutagenise comme en 1 a) avec les 
oligonucl6otides 

i 1 : 5 1 C ACGAGAGGATGTACA ACCTCGAGCGC A C AGTCACC3 ' 

10 contenant les mutations pour les sites de clonage BsrG I et Xho I, permettant 
1' introduction de la EGFP entre les acides amines 65 et 66 et 
i3: 

5 ' GTACCCAG ACACCAGCTAGCAGATCTGA AGCTTCGCC ATC AGGC3 1 
contenant les mutations pour les sites de clonage Nhe I, Bgl II et Hind III 

15 permettant 1' introduction de la EGFP entre les r6sidus 233 et 234 ou 233 et 238. 

Les plasmides obtenus pKS NK2R-il et -i3 sont introduits dans des 
bacteries XLlBlue compdtentes (transformation), et les echantillons d'ADN 
plasmidique isol6s k partir des colonies resistantes k l'ampicilline sont cribles 
pour la presence des sites introduits respectivement par les mutations k Taide 

20 des oligonucl6otides ilet i3. 

II) Clonage de la EGFP dans les boucles il et i3 du recepteur NK2R des 
tachykinines : 

- clonage dans la boucle il: les fragments Hind III - BsrG I, et Hind III - 
25 Xho I, de pKS NK2R-il sont ligu6s avec le fragment BsrG I - Xho I, 725 nt, de 
pEGFP C3-L V insert de 3741 nt codant pour la proteine de fusion est ensuite 
excisS par les enzymes Spe I et Sal I et ligu6 avec le vecteur pCEP4 ouvert par 
les enzymes Nhe I et Xho I pour conduire k la construction d'ADN pCEP4 
NK2R-RF2; 

30 - clonage dans la boucle i3: deux constructions sont obtenues: 

les fragments Nhe I - Bgl II, 744 nt, de pEGFP C3 sont ligu6s avec 
les fragments Not I - Nhe I et Bgl II - Not I de pKS-NK2R-i3, 
T insert Spe I - Sal I de 3750 nt ainsi obtenu est ensuite clon6 dans le 
vecteur pCEP4 entre les sites Nhe I et Xho I pour conduire k la 

35 construction d'ADN pCEP4-NK2R-RF3. 

les fragments Nhe I - Hind III, 757 nt, de pEGFP C3 sont ligues 
avec les fragments Not I - Nhe I et Hind III - Not I de pKS-NK2R- 
i3, r insert Spe I - Sal I de 3770 nt ainsi obtenu est ensuite clone 
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dans le vecteur pCEP4 entre les sites Nhe I et Xho I pour conduire a 
la construction d'ADN pCEP4-NK2R-RF4. 

BXEMPJUE 3 : EXPRESSION DES PROTEINES RECOMBINANTES 
5 ET CARACTERISATION FONCTIONNELLE 

I) Expression : 

Des cellules HEK 293 sont transferees, par la m£thode de la precipitation 
au phosphate de calcium (Chen & Okayama 1987, Mol. Cell. Biol. 7:2745- 

10 2752, Current Protocols in Molecular Biology, op.cit.), par les constructions 
d'ADN pCEP4-NK2R-RFl , -RF2, -RF3 et -RF4. Des lignees stables sont 
6tablies par selection des cellules transferees resistantes a l'hygromycine 
(100 /^g/rnl, Clontech). Les cellules sorit cultivees en presence d'hygromycine 
100 fjig/ml dans du milieu MEM (Gibco) supplement^ de 10% de s6rum de veau 

15 foetal (Seromed) de Penicilline (100 unit6s/ml), streptomycine (100 ng/ml) et 
glutamine (4 mM) (Methods in enzymology, Vol LVIII, 1979). 

II) Mesures de l'expression et propri&es de liaison des r6cepteurs 
recombinants : 

20 a) Par fluorim6trie : 

Les experiences de fluorescence sont effectu6es dans une cuve de 1 ml 
pourvue d'un systfcme d f agitation magn6tique et plac6e dans un 
spectrofluorimetre Fluorolog (SPEX) 6quip6 d'une lampe Xe 450W (Osram) et 
de monochromateurs Spex 1680 0.22m (excitation) et Spex 1681 0.22 m 

25 (emission). Les cellules ou les fragments de membrane sont mis en suspension 
dans du tampon physiologique: Hepes 10 mM, NaCl 137,5 mM, MgCl2 
1,25 mM, CaCl2 1,25 mM, KC1 6 mM, glucose 5,6 mM, NaH2P04 0,4 mM, 
BSA 0,1% (w/v),pH7,4. 

Les cellules entiferes sont r6colt6es aprfes traitement au Versfene (PBS, 

30 5 rnM EDTA), centrifiig6es 5 min. & 1.000 g et sont resuspendues a une 
concentration de 250.000-1.000.000 cellules/ml dans le tampon physiologique. 

La figure 4a montre les spectres d' excitation et 6mission enregistres avec 
des cellules transfect6es par les constructions pCEP4-NK2R-WT et pCEP4- 
NK2R-RF1. Les spectres font clairement apparaitre le signal de la EGFP et 

35 indiquent que ces constructions sont effectivement exprimees par les cellules 
HEK 293. La figure 4b montre les spectres 6mission de fluorescence de cellules 
exprimant le rdcepteur sauvage ainsi que les fusions -RF1 et RF2. 
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b) Par exp6rience de liaison : 

L'apparition de sites de liaison des neurokinines a la surface des cellules 
est determine par liaison de 0.1 nM 125l NKA ou 1 nM 3h SR48968 dans du 
PBS sur des cellules entieres en suspension (200-500.000 Cellules/ml, 
5 250 jtl/essai)r Apres 30 min. d'incubation a temperature ambiante, les 
dchantillons sont filtres sur filtres GF/C (Whatmann) pr6traites dans 1% de Iait 
en poudre dans du PBS (KC1 2.7 mM, KH2P04 1.47 mM, NaCl 0.137 mM, 
Na 2 HP04 8 .06 mM), rinc6s deux fois au PBS (4 ml), puis comptes dans un 
cocktail scintillant. 

10 Les courbes de saturation de la liaison de 3HSR 48 968 sont effectu6es 

dans du tampon Hepes 10 mM, NaCl 137,5 mM, MgCl2 1,25 mM, CaCl2 
1,25 mM, KC1 6 mM, glucose 5,6 mM, NaH2P04 0,4 mM, BSA 0,1% (w/v), 
pH 7,4 a 4°C pendant 1 h 30 en presence ou en absence de NKA 1 /jM final. 
Chaque 6chantillon de 500 fil contient 25 000 cellules, et la fraction de ligand 

15 lie est inferieure a 10% de la quantity ajoutee dans chaque tube. La filtration est 
effectude en fin d'incubation comme d6crit plus haut. les figures 5a et 5b 
montrent les courbes de liaison (en dpm li6s) obtenues avec des concentrations 
croissantes du ligand 3HSR 48968 sur respectivement des cellules exprimant le 
r6cepteur sauvage (NK2R WT) ou la fusion N terminale avec la EGFP (NK2R- 

20 RF1). Le ligand exhibe la m&ne affinity pour les deux recepteurs et le nombre 
de sites de liaisons exprimes a la surface des cellules est comparable. 

Ill) Tests fonctionnels : 

I) Mesure du calcium cytosolique a l'aide du FURA 2 : 
25 Le chelateur fluorescent du calcium, FURA 2 acetylmethylester 

(Molecular probes), dissout dans du DMSO est dilu6 a la concentration de 3 pM 
dans du tampon Hepes 10 mM, NaCl 137,5 mM, MgCl2 1,25 mM, CaCl2 
1,25 mM, KC1 6 mM, glucose 5,6 mM, NaH2P04 0,4 mM, BSA 0,1% (w/v), 
pH 7,4. Le milieu de culture des cellules est aspir6 puis remplac6 par 7 a 10 ml 
30 de la solution de FURA 2 AM. Les cellules sont placees dans I'incubateur a 
CO2 pendant 45 min. Le milieu est alors aspird, remplace par le tampon Hepes 
sans FURA et les cellules sont replacees dans I'incubateur a CO2 pendant 
15 min. supplementaires. Le tampon est aspir6, puis les cellules sont recoltees 
apres avoir 6te decrochees de la boite par une solution de PBS, 5 mM EDTA 
35 pendant 5 min. Apres centrifugation a 1000 x g pendant 5 min., le culot de 
cellules obtenu est resuspendu a raison de 1 x 10 6 cellules/ml dans le tampon 
Hepes. 
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Les mesures de liberation de calcium sont effectuees a 37°C, dans une 
cuve de spectrofluorimetre contenant par un barreau magnetique d'agitation. La 
longueur d'onde d'excitation est fixee a 34a nm et la longueur d'onde 
d'emission est fix6e a 510 nm. 

La figure 6, montre les r6sultats obtenus lors de la stimulation de cellules 
transferees avec la construction codant pour le recepteur sauvage (6a) et de 
cellules transferees par la construction pCEP4-NK2R-RFl (6b). Les r6ponses 
6voquees par la neurokinine A sont inhibees par les antagonistes NK2R 
sp6cifiques SR48968 (Sanofi recherche), MEN 10,376 (Bachem) ou le 
cyclopeptide cyclo(-Gln-Trp-Phe-Gly-Leu-Met) (Bachem). La neurokinine A 
n'dvoque aucune reponse sur des cellules HEK 293 non transferees. 

Preparation de fragments de membranes : 

Les fragments de membrane sont prepays par homog6neisation des 
cellules a l'aide d'un homogen&seur de tissu (potter ou ultraturax) en presence 
d'un melange d'inhibiteurs de proteases, a 4°C. Les cellules sont centrifug6es a 
1000 x G pendant 5 min. puis resuspendues dans du tampon de preparation de 
membranes: Tris-HCl 50 mM, EDTA-Na 1 mM, DTT 10 mM, contenant le 
cocktail d'inhibiteurs de proteases, Complete (Boehringer). La suspension est 
homogeneisee a l'aide d'un potter a 4°C. Apres centrifugation a 3000 x G 
pendant 10 min., le surnageant est collecte, le culot est repris dans le tampon ci- 
dessus, rehomogeneise, et centrifuge a nouveau. Les deux surnageants obtenus 
sont rassembies et centrifuges a 150 000 x g pendant 30 min. Les culots obtenus 
sont resuspendus dans du tampon de preparation de membranes a une 
concentration de 6-10 mg prot/ml. 

EXEMPLE 4 : PREPARATION DE LIGANDS FLUORESCENTS 

I) Preparation de neurokinine A fluorescente : 
a) Groupe Bodipy 530/560 : 

La NKA lyophilisee est dissoute dans de la DMF a 10 mM final. 
A 50 ixL de cette solution (0.5 M Mol, 50 fiL), on ajoute 10 M mol de NEt3 
(200 mM dans CH3CN), soit 100 /*L, puis 15 fiL de BODIPY 530/550 IA 

[N-(4,4-difluoro-5 ) 7-dimethyl-4-bora-3a,4a-diaza-s-indacene-3-propionyl)-N , - 
iodoacetylethylenediamine] dissout dans de la DMF a raison de 0.3 /iMol par 
10 /*L. Le melange est vortex6, puis laisse a temperature ambiante. Apres 24 h, 
le produit de la reaction est purifie par HPLC (Gilson) sur une colonne de phase 
inverse Z5C8 25F (Zorbax) sur iaquelle on developpe un gradient lineaire de 10 
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a 95% solvant B en 60 minutes (A: H20 0.1% TFA; B: CH3CN 0.1% TFA) 
avec un dSbit de 1 ml/rnin. Les longueurs d'ondes de d6tection sont fixees a 
219 nm (peptide) et 530 nm (fluorophore). Le produit 61u6 (NICA BO I) au 
temps 34 min. (Figure 7) est collecte, concentre par evaporation et resuspendu 
5 dans de la DMF. 

b) Groupes coumarine et 6osine : 

Les conditions r6actionnelles employees pour la marquage de la 
neurokinine A par les derives de coumarine (7-diethylamino-3-((4'- 

10 (iodoacetyl)amino)phenyl)-4-m6thylcoumarine) et d'dosine (6osine-5- 
iodoac6tamide) sont les memes que en a). Les purifications sont effectudes sur 
colonne de phase inverse Z5C8 25F (Zorbax) sur laquelle on ddveloppe un 
gradient lindaire de 10 a 95% solvant B en 60 minutes (A: H20 0.1% TFA; B: 
CH3CN 0. 1 % TFA) avec un ddbit de 1 ml/min. le derive coumarine de la NKA 

15 (NKA-Coum) est dlud au temps 25 min., le ddrivd dosine de la NKA (NKA- 
Eos) est dlud au temps 27 min. 

c) Groupe sulforhodamine 101 : 

Le rdactif utilisd est le chlorure d'acide de la sulforhodamine 101 
20 (Aldrich, ou Texas Red commercialisd par Molecular Probes). Le protocole est 
le mdme que pour le greffage du BODIPY 530/550 IA. La purification est 
effectuee par HPLC sur une colonne de phase inverse Z5C8 25F (Zorbax) sur 
laquelle on developpe un gradient lindaire de 10 a 95% solvant B en 60 minutes 
(A: H20 0.1% HFBA; B: CH3CN 0.1% HFBA) avec un debit de 1 ml/min. 
25 Les longueurs d'ondes de ddtection sont fixees a 219 nm (peptide) et 590 nm 
(fluorophore). le produit dlud (NKA TR) au temps 40-41 min. est collecte, 
concentrd par dvaporation et resuspendu dans de la DMF. 

EXEMPTS 5 : DETECTION DE L* INTERACTION ENTRE LE 
30 RECEPTEUR NK2R FLUORESCENT ET SES LIGANDS FLUORESCENTS. 

I) Par ddplacement d'un radioligand (experience de competition) : 
Les courbes de d6placement de la liaison de 3HSR 48968 par un ligand 
non radioactif sont effectudes dans du tampon Hepes 10 mM, NaCl 137,5 mM, 
35 MgCl2 1,25 mM, CaCl2 1,25 mM, KC1 6 mM, glucose 5,6 mM, NaH2P04 
0,4 mM, BSA 0,1% (w/v), pH 7,4 k 4°C pendant 1 h 30 en presence ou en 
absence de NKA 1 fiM final. Chaque 6chantillon de 500 /xl contient 
25 000 cellules, 1 nM de 3HSR 48968 et un ligand non radioactif a diff6rentes 
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concentrations (de 1 nM a 10 fiM). L'incubation est effectuee pendant 1 heure a 
4°C. La filtration est effective en fin d'incubation comme d6crit en 3b). 

La figure 8 montre les courbes de deplacement du radioligand 
3HSR 48968 par la neurokinin A (NKA) et la NKA BO I sur respectivement 
des ceUules HEK 293 exprimant le recepteur NBC2R sauvage (construction 
pCEP4-NK2R, figure 8A) ou la fusion de la EGFP en N-terminal du r6cepteur 
NK2R (construction pCEP4-NK2R-RFl, figure 8b). Les points repr6sentent la 
radioactivity liee (en dpm) en pr6sence de concentrations variables de NKA ou 
de NKA BO I. Les valeurs d'affinite deriv6es de ces courbes indiquent que la 
NKA (tout comme la NKA BO I) se lie avec la mdme affinit6 au recepteur 
sauvage et au recepteur rendu fluorescent. Les valeurs d'affinitS sont pour la 
NKA: KI= 3 nM sur le r6cepteur sauvage et 2,1 nM sur le recepteur 
fluorescent et pour la NKA BO I: KI= 16 nM sur le recepteur sauvage et 
16 nM sur le recepteur fluorescent. Les m6me mesures effectuees avec 
l'antagoniste MEN 10,376 conduisent aux valeurs d'affinite: KI= 53 nM sur le 
sauvage et KI= 61nM sur le recepteur fluorescent. 

II) Par transfert d'energie : 

a) interactions entre la NKA BO I et le r6cepteur NK2R-RF1 a l'6quilibre: 
Les cellules HEK293 exprimant le r6cepteur NK2R-RF1 sont placees en 
suspension a 1 000 000 cellules/ml dans le tampon physiologique Hepes (Hepes 
10 mM, NaCl 137,5 mM, MgCl2 1,25 mM, CaCl2 1,25 mM, KC1 6 mM, 
glucose 5,6 mM, NaH2P04 0,4 mM, BSA 0,1% (w/v), pH 7,4). Les cellules 
sont ensuite placees dans une cuve de fluorescence a une concentration pouvant 
varier de 100 000 a 1 000 000 cellules/ml. Un spectre d'emission de ces cellules 
est enregistr6 entre 490 et 600 nm (excitation 460 nm) puis la NKA BO I est 
ajoutee a une concentration finale de 100 nM. On enregistre a nouveau le 
spectre d'emission de la solution. On ajoute ensuite un exces (1-10 ^M) de 
ligand non marqu6 sp6cifique du recepteur NK2R (NKA non marquee ou de 
SR 48968 (Sanofi recherche) ou du peptide cyclique, cyclo(-Gln-Trp-Phe-Gly- 
Leu-Met), et on enregistre a nouveau le spectre d'emission de la solution. La 
Figure 9 montre les trois spectres superposes sur lesquels on d6tecte nettement 
une extinction de la fluorescence de la EGFP (pic a 510 nm) lors de l'addition 
de NKA BO I et un retour a la fluorescence initiale lors de l'addition 
subs6quente de ligand non marqu6. on d6tecte aussi l'apparition d'un pic a 550- 
560 nm lors de l'addition du ligand fluorescent et une diminution de soil 
intensity lors de l'addition de ligand non marqu6. Ces r6sultats indiquent 
l'occurrence d'un transfert d'6nergie entre le recepteur fluorescent et son ligand 
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fluorescent. Ce signal est renversable par addition d'un agent pharmacologique 
susceptible d'inhiber 1* interaction entre le ligand et son r6cepteur. L'addition de 
NKA non fluorescente sur des cellules exprimant le recepteur fluorescent 
NK2R-RF1 est sans effet sur le spectre d'emission de fluorescence. 

b) Interactions entre la NKA BO I et le recepteur NK2R-RF1 en temps 

reel : 

Les memes enregistrements peuvent 6tre effectues en temps reel. Pour 
cela, la longueur d'onde d'excitation est fixee a 460 ran et la longueur d'onde 
d' emission a 510 nra. L'addition de NKA BO I sur une suspension de cellules 
entratne une diminution de l'intensite de fluorescence a 510 nm et l'addition 
subsequente d'un exces de ligand non marque r6tablit la fluorescence a sa valeur 
initiale (voir figure 10). La valeur finale de l'intensit6 de fluorescence peut etre 
superieure a la valeur initiale lorsque I'absorption du ligand fluorescent 
contribue au signal. Ceci est observ6 avec la NKA BO I pour des concentrations 
sup6rieures a 200 nM, lorsque la concentration en cellules est de l'ordre de 
5x105 a 1x106 ceUules/ml. Enfin, l'addition de NKA non fluorescente au temps 
0 est sans effet sur l'intensit6 du signal mesur6 a 510 nM. 

c) D6tection de I'interaction entre le r6cepteur NK2R-RF1 et les ligands 
NKA TR et NKA Eos : - 

La reproduction de 1' experience decrite en a) avec la NKA TR (figure 
11a) ou la NKA Eos (figure lib) indique que la detection d'un signal 
d'interaction r6cepteur NK2R-RF1 ligand fluorescent n'est pas restreinte au 
couple EGFP-BODIPY mais peut aussi etre etendue aux couples EGFP- 
sulforhodamine 101 ou EGFP-Eosine. 

d) Experience de saturation de la liaison de NKA BO I a ses sites 
r6cepteurs : 

Etant donn6 que l'amplitude du signal enregistre selon la description en 8b 
(figure 12) est proportionnel a la concentration de NKA BO I ajoutee, on peut 
effectuer une mesure de l'amplitude du signal sp6cifique en fonction de la 
concentration de ligand ajout6. La figure 12a montre la variation d'amplitude du 
signal lorsque la concentration de NKA BO I ajoutee varie de 0 a 256 nM, par 
addition successive d'aliquots d'une solution stock de 10-5 M sur une 
suspension de 1 ml de cellules a 106 cellules/ml dans le tampon physiologique 
Hepes. Le traitement des donnees exp£rimentales (figure 12b) permet d'extraire 
une valeur d'affinite de la NKA BO I (KD = 20-30 nM) en excellent accord 
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avec les mesures effectives par emplacement d'un radioligand ainsi qu'il est 
d£crit dans I'exemple 5, 1). 

e) Experience de competition : 
5 Les fragments de membrane contenant le r^cepteur NK2R-RF1 prepares 

selon le procede d£crit dans I'exemple 3, section preparation de fragments de 
membranes, sont dilues dans le tampon Hepes (Hepes 10 mM, NaCl 137,5 mM, 
MgC12, 1,25 mM, CaC12 1,25 mM, KC1 6 mM, glucose 5,6 mM, NaH2P04 
0,4 mM, BSA 0,1% (w/v), pH 7,4) k raison de 20 fiL de membranes/ml. Des 

10 aliquots des membranes sont incubes en prdsence de NKA, MEN 10,376, de 
cyclo(-Gln-Trp-Phe-Gly-Leu-Met) ou de SR 48968 a differentes concentrations. 
Apres 30 minutes d ! incubation, les 6chantillons sont places dans une cuve de 
spectrofluorimStrie et le signal engendre par addition de NKA BO I 25 nM est 
enregistrS pendant 120 sec. k 510 nm, la longueur d'onde d'excitation ayant ete 

15 fix6e a 470 nm. L'amplitude du signal evoqu6 par Interaction entre le 
recepteur NK2R-RF1 et son ligand NKA BO I 6tant proportionnel au nombre de 
sites de liaison accessibles au ligand fluorescent, on peut 6tablir une courbe de 
d6placement de la NKA BO I par le ligand non fluorescent. 

On peut aussi proc6der par melange simultane des fragments de membrane 

20 contenant le recepteur NK2R-RF1, le ligand NKA BO I et le ligand non 
marqu6. Le m61ange est ensuite incube pendant le temps n6cessaire & atteindre 
Tequilibre de liaison (30-60 min.) et la fluorescence est mesur6e a 510 nm en 
fixant la longueur d'onde d'excitation k 470 nm. Les memes experiences 
peuvent etre effectuees avec des cellules entieres a la concentration de 250 000 a 

25 1 000 000 de cellules/ml. 

La figure 14 montre que Tamplitude du signal de fluorescence mesure a 
510 nm (excitation 460 nm) d6croit lorsque la concentration de molecule non 
fluorescente prdsente dans l'essai augmente. La courbe d r inhibition de la liaison 
de NKA Bo I permet d'estimer raffmit6 des mol6cules neurokinine A et 

30 SR48968 non fluorescentes. 

La figure 15 correspond a Texp6rience decrite dans la figure 14, effectu6e 
en pr6sence de neurokinine A (NKA) ou de SR48968. 



35 



EXEMPTS 6 : CLONAGE DE L'ADNC NK2R-RF1 DANS LE 
VECTEUR PPIC9 ET EXPRESSION DANS LA LEVURE PICHIA PASTORIS 
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a) Clonage : 

La partie de pCEP4-NK2R-RFl codant pour la proteine de fusion est 
amplifiee par PCR (Current Protocols in Molecular Biology, op.cit.) en utilisant 
les amorces 

5 5 1 GGAGAGTTCCAACTCGAGA AA AGA A AGA AGGGCGAGGAG3 ' et 

5 ' GTCAGCTGTTTCTGCGGCGCGCTA AGCCTGGGCCTT3 * 
permettant 1) la production d'un fragment de 1868nt codant pour la totality de la 
proteine de fusion NF2R-EGFP a T exception du peptide signal et 2) le clonage 
en phase dans le vecteur d' expression de ievure pPIC9 (invitrogen) avec la 
10 sequence codant pour le peptide signal du facteur alpha promoteur du gfcne 
AOX1. Les sites de clonage utilises sont respectivement XHoI pour ]'extremit6 
5* du produit d' amplification et Not I pour son extremity 3' 

b) Expression : 

15 Les levures sont transformees avec le plasmide pPIC9-NK2R-RFl 

Iin6aris6 (StuI ou Sail) et mises en culture sur milieu MD sans histidine, prepare 
selon les indications du manuel fourni avec le vecteur pPIC9 (inVitrogen). 
L'expression de la construction d'ADN introduite dans la cellules est induite par 
le M6thanol. Pour cela, les colonies sont propag6es en milieu liquide (BMGY) 

20 pendant 24 h, puis transferees dans du milieu BMMY contenant 0.5% de 
m6thanol permettant Tinduction de l'expression de la construction d'ADN 
NK2R-RF1. Des aliquots de ces cultures sont pr61ev6s et les clones exprimant la 
proteine fluorescente sont identifies par mesure des spectres d' excitation et 
d' emission de la EGFP. 

25 

EXEMPLE 7 : CONSTRUCTION D'ADN CODANT POUR LE RECEPTEUR 
MUSCARINIQUE DE L 1 ACETYLCHOLINE FUSIONNE AVEC LA EGFP 
ET EXPRESSION DANS LES CELLULES MAMMIFERES. 

30 

I) Clonage : le fragment d'ADNc codant pour le r6cepteur humain 
muscarinique Ml (Genbank Accession N° X15263) est amplify par PCR 
(Current Protocols in Molecular Biology, op.cit.) en utilisant les amorces : 
5 1 TT AGTTCT A A ACT AGCGGCCGC ACTAGTCCTCC ATG A AC ACTTCAGC 
35 CCCA3 1 et 

5 1 CTTG A A CCT AT AGCT AGCCTCGAGTC AGC ATTGGCGGG AGGG3 1 . 

Le fragment de 1383 nt obtenu est cliv6 par les enzymes Not I (en 5") et 
Xho I (en 3') et ligud avec le vecteur KS ouvert par les mSmes enzymes 
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(fragment de 2888nc) pour conduire a la construction KS-hMl, ou ligu6 avec le 
vecteur pCEP4 ouvert par les memes enzymes pour conduire a la construction 
pCEP4-hMl. 

La construction KS-hMl est utilis6e pour la production d'ADN simple 
brin (Current Protocols in Molecular Biology, op.cit.) et l'obtention de mutants. 

II) fusion de la EGFP en N-terminal du r6cepteur hMl. 

L' oligonucleotide 5 , CCTGCTGTCTCAGATCTCATCACCGTCC3 , est 
utilis6, conjointement avec les r6actifs du kit de mutagenese Sculptor 
(Amersham) pour produire un mutant permettant la fusion en position 13 de la 
s6quence codante du recepteur hMl grace a 1* introduction d'un site de 
restriction pour I' enzyme Bgl II. 

Le mutant obtenu est diger6 par les enzymes Bgl II et Xho I et le fragment 
de 1354 nt engendre\ est ligue avec le fragment Not I - Bgl II, 812 nt, de 
pCEP4-NK2R-RFl, et le vecteur pCEP4 ouvert par les enzymes Not I et Xho I, 
pour conduire a la construction d'ADN pCEP4-hMl-RFl. 

III) expression de la proteine de fusion hMl-RFl . 

Le plasmide pCEP4-hMl-RFl est introduit dans des cellules HEK 293 par 
transfection au phosphate de calcium ou dans des cellules Cos 1 par 
61ectroporation (Current Protocols in Molecular Biology, op.cit.). 

L' expression de la proteine est d6tect6e comme d6crit plus haut. 

IV) synthese et purification du ligand muscarmique ABT-Bodipy. 
L'ABT base (3-[2'-aminobenzhydryloxy]tropane) est mis en solution dans 

la DMF (10 mM). 20 fx\ de cette solution (0.2 /iMoles) sont m6Iang6s avec 4 fil 
d'une solution 100 mM de Bodipy -IA et laiss6s a tempSrature ambiante pendant 
20 h. Le produit de la reaction est purifi6 par HPLC (Gilson) sur une colonne 
de phase inverse Z5C8 25F (Zorbax) sur laquelle on d6veloppe un gradient 
lineaire de 10 a 95 % solvant B en 60 minutes (A: H2O 0.1% TFA; B: CH3CN 
0.1% TFA) avec un d6bit de 1 ml/min. Les longueurs d'ondes de d6tection sont 
fix6es a 219 nm (peptide) et 530 nm (fluorophore). Le produit 61ue (ABT Bo) au 
temps 34 min. (Figure 7) est collects, concentre par evaporation et resuspendu 
dans de la DMF; 

V) fusion de la EYFP en N-terminal du r6cepteur hMl et detection de 
1' interaction avec la pirenzepine-bodipy 558/568. 



WO 98/55873 



PCT/FR98/01136 



56 

Cette construction est" realis6e de maniere identique a la constraction 
decrite au point II. 

Les interactions de la proteine de fusion avec son ligand sont effectuees a 
1'aide du ligand pirenz6pine-bodipy dans lequel le groupe fluorescent correspond 

au bodipy 558/568 (4,4-difluoro-5-(2-thienyl)-4-bora-3a,4a-diaza-s-indacene-3- 
propionic acid). 



EXEMPLE 8 : CONSTRUCTION D'ADN CODANT POUR DES 
10 RECEPTEURS NICOTINIQUES FLUORESCENTS 

a) Construction d'ADN codant pour la fusion de la EGFP dans la region 
MIR du recepteur a7-V201-5HT3. 

Le plasmide pJL223 (Eisel6 et al. 1993, Nature 26^:479-483) contient Ie 
15 gene de la proteine a7-V201-5HT3 qui forme un r6cepteur canal active par 
I' acetylcholine et la nicotine lors de son expression dans des ovocytes de 
X6nope. l'ADNc codant est compris entre les sites Not I et Xho I du vecteur 
pMT3 (Swick, A.G. et al. 1992, Proc. Natl. Acad. Sci. 22: 1812-1816). 

L' insert Not I - Xho I de 1424 nt est clon6 entre les sites Not I et Xho I du 
20 vecteur Bluescript et le plasmide obtenu (KS 223) sert de matrice a la 
production d'ADN simple brin. 

L ' oligonucldotide 

5 ' CAGATC ATTAGTTGTAC AGGAA AGATCTTGAGGATCCTGGAGTGA A 
G3' 

25 est utilis6 pour introduire, sur KS223, les sites de restriction pour les enzymes 
Bsrg I, Bgl II et BamH I dans la mSme phase que celle des sites identiques 
portes par le plasmide pEGFP-C3. La mutation est introduite au niveau d'une 
region du r6cepteur appetee MIR (Major Immunogenic Region, Barkas et al. 
1987, Science, 225:77-80) entre les acides amines 63 et 64. 

JO Les fragments Not I-BsrG I (267 nt) et Bgl H-Xhb I (1147 nt) de ce 

mutant de KS 223 sont ligu6s avec le fragment BsrG I-Bgl II (721 nt) de 
pEGFP-C3 et le vecteur pCEP4 ouvert par les enzymes Not I et Xho I, pour 
conduire a la construction d'ADN pCEP4-223-RFl. 

Les fragments Not I-BsrG I (267 nt) et BamH I-Xho I (1138 nt) de ce 

$5 mutant de KS 223 sont ligu6s avec le fragment BsrG I-BamH I (772 nt) de 
pEGFP-C3 et le vecteur pCEP4 ouvert par les enzymes Not I et Xho I, pour 
conduire a la construction d'ADN pCEP4-223-RF2. 
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b) Construction d'ADN codant pour la fusion de la EGFP dans la region 
cytoplasmique du recepteur cc7-V201-5HT3 

L'ADNc codant pour la prot6ine a7-V201-5HT 3 contient dans son 
domaine cytoplasmique les sequences des sites Avr II et Pst I respectivement en 
phase et cohesive avec les sequences clivees par les enzymes Nhe I et Pst I du 
plasmide pEGFP-C2 (ClonTech) et permettent l'obtention d'un prot6ine de 
fusion contenant la s6quence de le EGFP dans le domaine cytoplasmique de la 
proline a7-V201-5HT3. 

La construction d'ADN codant pour cette proteine de fusion est done 
obtenue par ligation des fragments Not I-Avr II (1036 nt) et Pst I - Xho I (286 
nt) de KS 223 avec le fragment Nhe I - Pst I (774 nt) de pEGFP-C2 et le vecteur 
pCEP4 ouvert par les enzymes Not I et Xho I pour conduire a la construction 
PCEP4-223-RF3. 

Les constructions pCEP4-223-RFl, -RF2, et -RF3 sont ensuite exprimees 
dans des cellules HEK 293 ainsi que decrit plus haut. 



EXEMPT ,F, 9 : CONSTRUCTION D'ADN CODANT POUR UN 
RECEPTEUR DES CHIMIOKINES FLUORESCENT 

Le cDNA codant pour le recepteur CCR5 humain des chimiokines 
(numero d'acces Genbank : U54994) est amplifie a l'aide des oligopeptides 
5 'GGCCCAAGCTTATGTCAGGATCCGGGGAT3 ' e t 
5 'CGCCCGCTCGAGTCACAAGCCCACAGATAT puis clon6 dans le vecteur 
Bluescript KS ouvert par l'enzyme de restriction Eco RV. 

L'insert est excis6 par les enzymes Hind m ou BamHl (5') et Xho I (3') 
(fragment 1) pour &re clone en phase avec le cDNA codant pour la EGFP ou la 
ECFP. 

La fusion en phase de la EGFP ou la ECFP avec le peptide signal du 
plasmide pJL223 (exemple 1) et le gene codant pour le recepteur CCR5, est 
effectuee de la maniere suivante. Le plasmide pJL223 est ouvert par Tenz'yme 
de restriction Age I puis rendu franc par m61ange avec la Klenow et des 
nucleotides. Le fragment s'6tendant jusqu'au site Xho I est ensuite 61imin6 
(coupure Xho I) (fragment 2) . 

Les plasmides pEGFP-C3 et pECFP-C3 sont ouverts par l'enzyme Age I 
et les extremes sont rendues tranches. Les inserts Age I franc- Hind III et Age 
I franc- Xho I (fragments 3) sont ligues avec les fragments 1 et 2 pour donner 
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lieu au constructions KS-SP EGFP-Hind ni-CCR5, KS-SP EGFP-Xho I-CCR5, 
KS-SP ECFP-Hind III-CCR5 et KS-SP ECFP-Xho I-CCR5. Les ADNs 
correspondant aux s6quences SP EGFP-Hind IH-CCR5, SP EGFP-Xho I-CCR5, 
SP ECFP-Hind III-CCR5, et SP ECFP-Xho I-CCR5 sont excises par Not I et 
5 Xho 1 puis clones dans le vecteur pCEP4 ouvert pas les memes enzymes. 

La figure 16 montre le spectre d'emission de cellules HEK 293 
transfect6es et exprimant le r6cepteur EGFP-Hind III-CCR5, et la figure 17 
montre la reponse de libdration de calcium intracellulaire de cellules exprimant 
10 la construction d ' AND EGFP-HindCCR5. 



EXEMPLE 10 : CONSTRUCTION D'ADN CODANT POUR LA 
CHIMIOKINE HUMAINE RANTES FLUORESCENTE 

15 

L'ADNc codant pour la chimiokine RANTES humaine (numero d'acces 
Genbank M21121) est synth6tis6 par PCR recursive a l'aide des oligonucleotides 

5 ' GTTGACAAGCTTCGGGATCCA3 ' 

5 ' AGCAC AGAGGGC AGTAGC AATGAGGATG ACAGCG 
AGGCGTGCCGCGGAGACCTTCATTGGATCCCGAAGCTTGTCAAC3' 

5 ' ATTGCTACTGCCCTCTGTGCTCCTGC ATCTGCCTCC 
CCATATTCCTCGGACACCACACCATGCTGCTTCGCCTACATT3' 

5 ' GC ACTTGCC ACTGGTGTAGA A ATACTCCTTG ATGTGG 
GCACGGGGCAGTGGGCGGGCAATGTAGGCGAAGCAGCATGG3 1 

5 1 GC ACTTGCC ACTGGTGTAGA AATACTCCTTGATGT 
GGGCACGGGGCAGTGGGCGGGCAATGTAGGCGAAGCAGCATGG3' 

5 ' CTAGCTCATCTCCAGCGAGTTGATGTACTCCCGA ACC 
CATTTCTTCTCTGGGTTGGC ACA AACTTGACG3 ' 

5 ' A ACTCGCTGGAGATG AGCT AGGCGGCCGCTCG 
AGGTCGACCTAGTCACTA3 ' 



1 

20 

2 
3 

25 
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selon les protocols decrits dans Prodromou & Pearl, Protein Engineering 
Vol 5, pp 827-829, 1992, puis clone dans le vecteur Bluescript KS ouvert par 
Eco RV. 

Les ADN codant respectivement pour la chimiokine RANTES (fragment 
Hind III - Not I ou Bam HI-Not I) et pour la proline fluorescente jaune 
(fragments Age I franc - Bam HI ou Age I franc - Hin Dm du plasmide pEYFP- 
C3) sont clon6s en phase avec le peptide signal de l'alpha-mating factor de 
levure entre les sites Sna BI et Not I du vecteur pPIC 9, pour conduire aux 
constructions pPIC9-EYFP- Hindlll-RANTES et pPIC9-EYFP-Bam HI- 
RANTES. 

La figure 18 montre un immunoblot revdlant I' expression de la 
construction EYFP- Hindlll-RANTES dans un surnageant de culture de levure 
pichia pastoris transformde par le plasmide pPIC9-EYFP- Hindlll-RANTES, et 
d6tect6e a 1'aide d'une anticorps anti-GFP. 



EXEMPLP 11 : IDENTIFICATION DE NOUVEAUX LIGANDS POUR 
DES RECEPTEURS ORPHELINS 

1) fusion de la EGFP avec l'extr6mite carboxyterminale du r6cepteur 
NK2R des tachykinines. 

l'ADNc codant pour le rScepteur NK2R compris dans le plasmide pKS 
NK2R (exemple 1) est cliv6 par l'enzyme Age I. L'extr6mit6 5' d6passante 
obtenue est rendu franche a l'aide de nucleotides et de la Klenow polymerase. 
L'ADN linearis6 est cliv6 par 1'enzyme Not I pour produire un fragment de 
1045 nt (fragment a). 

Le plasmide pEGFP-C3 est ouvert a l'aide de l'enzyme Age I puis rendu 
franc. II est ensuite cliv6 par l'enzyme Xho I pour conduire a un fragment b, de 
739 nt. 

Les fragments a et b sont ligues avec le vecteur pCEP4 ouvert par les 
enzymes Not I et Xho I pour conduire au plasmide pCEP4-NK2R-AgeI-EGFP. 

2) fusion de la proline fluorescente EYFP avec l'extremite 
aminoterminale de la sous-unit6 alpha de la proteine Gq de souris. 
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L'ADNc codant pour la sous-unite" alpha de la proline Gq de souris 
(Genbank accession N° M55412) est amplified par PCR a l'aide des 
1' oligonucleotides 

5'GCGGCCGCATGGGGGATCCTACTCTGGAGTCCATCATGGCG et 5' 
CCGCTCGAGTTAATCTAGAAGGACCAGATTGTACTCCTTCAGG afm 
d'introduire des sites Not I et Bam HI en 5' et des sites Xho I et Xba I en 3' du 
gene codant pour la sous-unite alpha de la proteine Gq. 

Le produit PCR obtenu est clon6 dans le vecteur KS ouvert par Eco RV . 

Le cDNA codant pour la sous-unite alpha Gq est excise" par les enzymes 
BamHI et Xba I et ligue" dans le plasmide pEYFP-C3 ouvert par les enzymes 
Bgl II et Xba I pour conduire au plasmide pEYFP-Bgl II-Gq . 

3) coexpression du r6cepteur NK2R-Age I-EGFP et de la proteine EYFP- 
Bgl II-Gq . 

Des cellules HEK 293 sont transferees a l'aide des plasmides pEYFP-Bgl 
II-Gq ou P CEP4-NK2R-AgeI-EGFP epEYFP-Bgl II-Gq Les cellules exprimant 
le produit des genes du plasmide pCEP4 sont s61ectionnees a l'aide de 
l'antibiotique hygromycine B, celles qui expriment les produits du gene du 
plasmide pEGFP modifi6 sont selectionnees a l'aide de n6omycine. 

4) tests de fonctionnalite" de la prot6ine Gq fluorescente. 

lis sont effectu6s par le biais d'6tudes fonctionnelles de liberation de 
calcium. La surexpression de prolines G entraine une augmentation de 
1' amplitude des r6ponses calciques. 

5) les cellules exprimant la prot6ine Gq de maniere stable sont transfect6es 
a l'aide d'un plasmide d'expression codant pour un recepteur orphelin. L'effet 
de molecules est mesur6 par fluorescence a 405 nm en excitant la suspension de 
cellules a 355 nm. 
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REVENDICATIONS 



10 



1. Utilisation d'une proteine fluorescente choisie parmi les proteines 
fluoreseentes issues ou derivees de proteines autofluorescentes de cnidaires, 
dont le coefficient d' extinction moteculaire est sup&rieur a environ 
MOOOMW 1 et le rendement quantique de fluorescence est superieur k environ 
0,38, notarament choisie parmi : 

- la proteine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition, delation ou 
substitution d'un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propriety de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la propria de fluorescence, 

15 pour la detection et la quantification d* interactions non covalentes entre une 
prot6ine cible marquee par voie g6netique par la GFP ou Tun des variants ci- 
dessus definis ou Tun des fragments ci-dessus dSftnis et Tun de ses ligands 
marqu6 par un marqueur constitu6 : 

- soit par une molecule susceptible d' absorber la lumiere 6mise par 
20 la proline fluorescente, 

- soit par une substance fluorescente, 

cette detection et quantification ay ant lieu par transfert d'6nergie de 
fluorescence: 

• entre la GFP ou Tun des variants definis ci-dessus, ou Tun des 
25 fragments d6fmis ci-dessus et la susdite substance fluorescente, la 

substance fluorescente 6tant telle que soit elle est excitable a la 
longueur d'onde d'emission de la GFP ou de Tun des susdits 
variants, ou de Tun des susdits fragments, soit elle 6met a la 
longueur d'excitation de la GFP, ou de Tun des susdits variants, ou 
30 de Tun des susdits fragments, ou 

. entre la GFP ou Tun de ses variants definis ci-dessus, ou l'un des 
fragments d6finis ci-dessus, et la susdite molecule susceptible 
d 1 absorber la lumifere emise par la proteine fluorescente. 

35 2 - Utilisation d'un ligand marqu6 par un marqueur constitue : 

- soit par une molecule susceptible d' absorber la lumiere 6mise par 
la proteine fluorescente, 

- soit par une substance fluorescente, 
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pour la detection et la quantification d' interactions non covalentes entre une 
proteine cible et le susdit ligand, ladite proteine cible 6tant marqu6e par voie 
genetique par une proteine fluorescente choisie parmi les prot6ines fluorescentes 
issues ou d6riv6es de proteines autofluorescentes de cnidaires, dont le coefficient 
d'extinction moleculaire est superieur a environ MOOOM'cm 1 et le rendement 
quantique de fluorescence est superieur a environ 0,38, notamment choisie 
parmi : 

- la proteine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition, d61etion ou 
substitution d'un ou plusieurs acides amin6s, sous reserve que ces variants 
conservent la propriety de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la propri6t6 de fluorescence, 

cette detection et quantification ayant lieu par transfert d*6nergie de 
15 fluorescence: 

. entre la GFP ou Tun des variants d6finis ci-dessus, ou l'un des 
fragments definis ci-dessus et la susdite substance fluorescente, la 
substance fluorescente 6tant telle que soit elle est excitable a la 
longueur d'onde d'emission de la GFP ou de l'un des susdits 
variants, ou de l'un des susdits fragments, soit elle emet a la 
longueur d'excitation de la GFP, ou de l'un des susdits variants, ou 
de l'un des susdits fragments, ou 

. entre la GFP ou l'un de ses variants d6finis ci-dessus , ou l'un des 
fragments d6finis ci-dessus, et la susdite mol6cule susceptible 
25 d' absorber la lumiere eniise par la proteine fluorescente. 

3. Utilisation selon la revendication 1, dans laquelle la proteine 
fluorescente est choisie parmi : 

- la prot6ine fluorescente verte (GFP ou EGFP), 

- la prot6ine fluorescente cyan (CFP ou ECFP), 

- la prot6ine fluorescente jaune (YFP ou EYFP), 

- GFPUV, 

ou leurs mutants dans lesquels les codons sont optimises pour l'expression dans 
les cellules humaines, bacteriennes ou v6getales, 

ou leurs mutants presentant des longueurs d'excitation ou d'emission plus 
elev6es ou plus faibles que celles associees aux prolines definies ci-dessus, sous 
reserve que leur coefficient d'extinction moleculaire soit sup6rieur a environ 
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14000M-W et leur rendement quantique de fluorescence soit superieur a 
environ 0,38. 

4. Utilisation d'une proteine fluorescente (n° 1) selon I'une des 
revendications 1 ou 3, dans laquelle le ligand est marqu6 

* soit par une substance fluorescente, Ie marquage etant : 

- soit effectue par voie chimique, la substance fluorescente 6tant 
alors un compose chimique, 

- soit effectu6 par voie recombinante, la substance fluorescente 
&ant alors un peptide ou une proline fluorescente (n° 2), et pouvant etre 
notamment choisie parmi les proteines fluorescentes issues ou d6rivees de 
proteines autofluorescentes de cnidaires, dont le coefficient d'extinction 
moleculaire est supdrieur a environ MOOOM W et le rendement quantique de 
fluorescence est superieur a environ 0,38, notamment choisie parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants d6rives de la GFP, par addition , deletion ou 
substitution d'un ou plusieurs acides amines, sous r6serve que ces variants 
conservent la propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la propri6te de fluorescence, 

* soit par une substance non fluorescente appartenant au groupe des acides 
violets [Acid Violet 5, CAS 10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ; Acid 
Violet 17, CAS 4129-84-4], acides rouges [Acid Red 1, CAS 3734-67-6 ; Acid 
Red 8, CAS 4787-93-3 ; Acid Red 37, CAS 6360-07-2 ; Acid Red 40, CAS 
12167-45-2 ; Acid Red 106, CAS 6844-74-2 ; Acid Red 114, CAS 6459-94-5], 
les alizarines, l'aluminon, 1'azocarmine B [CAS 25360-72-9], la fuschine 
basique [Basic Red 9, CAS 569-61-9], le Bordeaux R [Acid Red 17, CAS 5858- 
33-3], la Carmine [CAS 1390-65-4]. 

5. Utilisation d'une proline fluorescente selon l'une des revendications 
1, 3 ou 4 dans la quelle la proteine cible et le ligand sont marqu6s par voie 
genetique, la prot6ine fluorescente et la substance fluorescente etant 
respectivement choisies parmi les couples de composes suivants : 

GFPUV - EYFP 

EYFP - GFPUV 

ECFP - EYFP 

EYFP - ECFP 

ECFP-EGFP 
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EGFP - ECFP 

EGFP - EYFP 
EYFP - EGFP 

et notamment dans laquelle la proteine cible est marquee par la proteine 
5 EYFP ou EGFP et le ligand est marqu6 par la proteine ECFP, ou la proline 
cible est marquee par la prot6ine ECFP et le ligand est marque par la proteine 
EYFP ou EGFP. 

6. Utilisation selon la revendication 1 d'une proteine fluorescente 
10 choisie parmi les proteines fluorescentes issues ou derives de prolines 

autofluorescentes de cnidaires, dont le coefficient d* extinction moleculaire est 
superieur a environ 14000M' 1 cm" 1 et le rendement quantique de fluorescence est 
superieur a environ 0,38, notamment choisie parmi : 

- la prot&ne fluorescente verte (GFP), ou 

15 - des variants d6riv6s de la GFP, par addition, d616tion ou 

substitution d'un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propri&6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous rdserve que ces fragments conservent la propriety de fluorescence, 

20 pour la detection et la quantification d ! interactions non covalentes entre 

une proteine cible marquee par voie g6n6tique par la GFP ou Tun des variants 
ci-dessus d6fmis ou Tun des fragments ci-dessus d6finis et Tun de ses ligands 
marqu6 par une substance fluorescente, cette detection et quantification ayant 
lieu par transfert d'6nergie de fluorescence entre la GFP ou Tun des variants 

25 definis ci-dessus, ou Tun des fragments d6finis ci-dessus et la susdite substance 
fluorescente, la substance fluorescente 6tant telle que soit elle est excitable k la 
longueur d'onde d*6mission de la GFP ou de Tun des susdits variants, ou de 
Tun des susdits fragments, soit elle 6met k la longueur d'onde d'excitation de la 
GFP, ou de Tun des susdits variants, ou de Tun des susdits fragments. 

30 

7. Utilisation selon Tune des revendications 1 a 6, dans laquelle la 
proteine fluorescente est EGFP et dans laquelle : 

- soit la EGFP est donneur d'energie de fluorescence et le 
marqueur absorbant la lumiere emise par la EGFP est une substance 

35 fluorescente ou non, et le marqueur 6tant choisi parmi des substances, dont le 
spectre d'excitation chevauche le spectre d'6mission de la EGFP, et notamment 
dans le cas oil le marqueur est une substance fluorescente, il est choisi parmi : le 
4,4-difluoro-4-bora-3a,4a-diaza-s-indacene (Bodipy), Teosine, r6rythrosine, la 
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tetram6thylrhodamine, la sulforhodamine 101 commercialis6e par Molecular 
probe sous la d6nomination Texas Red, et leurs derives permettant d'une part le 
greffage et, d'autre part, dont le spectre d'excitation recouvre le spectre 
d'emission de EGFP, 

et dans le cas ou le marqueur n'est pas une substance 
fluorescente, il est choisi parmi le groupe des acides violets [Acid 
Violet 5, CAS 10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ■ 
Acid Violet 17, CAS 4129-84-4], acides rouges [Acid Red l[ 
CAS 3734-67-6 ; Acid Red 8, CAS 4787-93-3 ; Acid Red 37 
CAS 6360-07-2 ; Acid Red 40, CAS 12167-45-2 ; Acid Red 106* 
CAS 6844-74-2 ; Acid Red 114, CAS 6459-94-5], les alizarines,' 
l'alurainon, l'azocarmine B [CAS 25360-72-9], la fiischine 
basique [Basic Red 9, CAS 569-61-9], le Bordeaux R [Acid Red 
17, CAS 5858-33-3], la Carmine [CAS 1390-65-4], 

- soit la EGFP est accepteur d'energie de fluorescence et la 
substance fluorescente est donneur d'energie de fluorescence et est choisie parmi 
des substances, dont le spectre demission chevauche le spectre d'excitation de 
la EGFP, et notamment parmi : les coumarines, la fluorescamine le 
6-(N-m6thylanilino)naphtalene, (mansyl) et leurs derives permettent d'une part 
le greffage et, d'autre part, dont le spectre d'dmission recouvre le spectre 
d'excitation de EGFP, 

- ou soit la prot6ine fluorescente est ECFP et est donneur d'energie 
de fluorescence et la substance fluorescente est accepteur d'energie et est choisi 
parmi la fluoresceine et le 7-nitrobenz-2-oxa-l,3-diazole, 

- ou soit la proteine fluorescente est ECFP et est accepteur 
d'energie de fluorescence et la substance fluorescente est donneur d'energie et 
est choisie parmi le pyrene ou la coumarine ou leurs deriv6s permettant d'une 
part le greffage, et, d'autre part, dont le spectre d'emission chevauche le spectre 
d'excitation de la ECFP. 

8. Utilisation selon l'une des revendications 1 a 7, dans laquelle la 
proline cible est choisie parmi : 

- les r6cepteurs membranaires couples a la prot6ine G, notamment 
dans Supplement Trends in Pharmacological Sciences, 1997 (Receptor and ion 
Channel Nomenclature), 

- les recepteurs des facteurs de croissance, notamment ceux qui 
sont structurellement reli6s au recepteur de 1'insuline (Yarden, Y. and Ullrich 
A. 1988, Biochemistry 22:3113-3119) ou au r6cepteur de 1'interferon y (Brisco' 
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J. et al. 1996, Phylos. Trans. R. Soc. Lond. B. Biol. Sci. Ml: 167-171 ; Ihle, 
J.N. 1995, Nature 222:591-594), 

- les r6cepteurs canaux, notamment dans Supplement Trends in 
Pharmacological Sciences, 1997 {Receptor and ion Channel Nomenclature), 

5 - les recepteurs nucleaires intracellulaires, notamment ceux qui sont 

structurellement reli6s au recepteur des stero'ides (Mangelsdorf et al. 1995, Cell, 
£2:835-839 ; Wurtz, J.L. et al. 1996, Nature Struct. Biol. 2:206). 

9. Utilisation selon l'une des revendications 1 a 8, dans laquelle la 
10 prot6ine cible est choisie parmi les r6cepteurs membranaires couples a la 

prot6ine G. 

10. Procede de detection et de quantification d' interactions non 
covalentes entre une proteine cible, notamment un r6cepteur, et l'un de ses 

15 ligands, caracteris6 en ce que : 

- on prepare des cellules soit des fragments de cellules exprimant 
une sequence d'ADN comprenant le gene codant pour une prot6ine fluorescente 
fusionnee avec le gene de la proline cible, la fusion entre le gene de la prot6ine 
fluorescente et le gene de la susdite prot6ine cible etant telle que les proprietes 

20 de la proteme cible, notamment du recepteur, ne sont pas modifies par la 
presence de la prot6ine fluorescente, a savoir : 

* I' interaction entre la prot6ine cible, notamment le r6cepteur, et le 
ligand n'est pas modifide, 

* la fonction de transduction de la reponse n'est pas modifiee, la 
25 prot6ine fluorescente etant choisie parmi les proteines fluorescentes 

issues ou derivees de prot6ines autofluorescentes de cnidaires, dont 
le coefficient d'extinction. mol6culaire est superieur a environ 
MOOOM-'cm-' et le rendement quantique de fluorescence est 
sup6rieur a environ 0,38, notamment choisie parmi : 
J0 - la prot6ine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition , deletion ou 
substitution d'un ou plusieurs acides amines, sous rdserve que ces variants 
conservent la propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
$5 sous r6serve que ces fragments conservent la propri6t6 de fluorescence, 

- on met en pr6sence les susdites cellules ou les susdits fragments 
de cellules avec un ligand de la susdite prot6ine cible, notamment du susdit 
r6cepteur, marqu6 par un marqueur constitu6 : 
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- soit par une molecule susceptible d'absorber la lumiere 6mise par 
la proteine fluorescente, 

- soit par une substance fluorescente, 

et soit la proline fluorescente 6tant donneur d'6nergie de fluorescence et le 
5 marqueur etant accepteur d'energie de fluorescence, ou soit la prot6ine 
fluorescente 6tant accepteur d'energie de fluorescence et le marqueur 6tant une 
substance fluorescente donneur d'energie de fluorescence, et 

- on irradie k une longueur d'onde permettant soit d" exciter la 
proteine fluorescente, soit d' exciter la substance fluorescente, 

10 - les susdites etapes de mise en presence et d' irradiation pouvant 

etre effectuees soit simultanement, soit Tune apres 1' autre, ou 

- on met en presence les susdites cellules ou les susdits fragments 
de cellules avec un ligand de la susdite proteine, notamment du susdit recepteur, 

15 marqu6 par un marqueur, les cellules ou le ligand ayant 6te irradies 
prealablement a leur mise en presence, 

- on d6tecte soit une diminution d 1 amplitude de remission du 
donneur et/ou un signal demission caracteristique de remission de l'accepteur. 

20 11- Proc6d6 de detection et de quantification d* interactions non 

covalentes entre une prot6ine cible, notamment un r6cepteur, et Tun de ses 
ligands, caract6ris6 en ce que : 

- on pr6pare une prot6ine fluorescente fusionnee avec une proline 
cible dont on veut determiner V interaction prot6ine-ligand, la fusion entre la 

25 proteine fluorescente et la susdite proteine cible 6tant telle que les propri&es de 
la proteine, notamment du recepteur, ne sont pas modifies par la presence de la 
prot6ine fluorescente, a savoir : 

* l 1 interaction entre la proline cible, notamment le recepteur, et le 
ligand n'est pas modifide, 

30 * la fonction de transduction de la reponse n'est pas modifi6e, 

la prot6ine fluorescente 6tant choisie parmi les prolines fluorescentes issues ou 
derivees de prolines autofluorescentes de cnidaires, dont le coefficient 
d' extinction mol6culaire est sup6rieur k environ HOOOM^cm" 1 et le rendement 
quantique de fluorescence est sup6rieur a environ 0,38, notamment choisie 

35 parmi : 

- la prot6ine fluorescente verte (GFP), ou 
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- des variants d6riv6s de la GFP, par addition , d&etion ou 
substitution d'un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propri6te de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
5 sous reserve que ces fragments conservent la propriete de fluorescence, 

- on met en presence la susdite proteine fluorescente fusionnee avec 
la proteine cible avec un ligand de la susdite proline, notamment du susdit 
recepteur, ce ligand etant marqu6 par un marqueur constitu6 : 

- soit par une motecule susceptible d' absorber la lumiere emise par 
10 la proteine fluorescente, 

- soit par une substance fluorescente, 

et soit la proteine fluorescente Stant donneur d'energie de fluorescence et le 
marqueur 6tant accepteur d'energie de fluorescence, ou soit la proteine 
fluorescente 6tant accepteur d'6nergie de fluorescence et le marqueur est une 
15 substance fluorescente donneur d'dnergie de fluorescence, et 

- on irradie a une longueur d'onde permettant soit d'exciter la 
proteine fluorescente, soit d'exciter la substance fluorescente, 

- les susdites etapes de mise en presence et d' irradiation pouvant 
Stre effecru6es soit simultan6ment, soit Tune apres l'autre, ou 

20 " on met e & presence la susdite proteine fluorescente fusionnee avec 

la proteine cible avec un ligand de la susdite proteine, notamment du susdit 
r6cepteur, ce ligand 6tant marqu6 par un marqueur constinte : 

- soit par une molecule susceptible d' absorber la lumiereemise par 
la proteine fluorescente, 

25 - soit par une substance fluorescente, 

la proteine fluorescente fusioiutee avec la proteine cible ou le ligand ayant ete 
irradi6s pr6alablement a leur mise en pr6sence, 

- on d6tecte soit une diminution d' amplitude de remission du 
donneur et/ou un signal d'6missipn caracteristique d'emission de l'accepteur. 

30 

12. Proced6 selon l'une des revendication 10 ou 11, dans lequel on 
introduit une 6tape supptementaire : 

- avant ou apres, ou simultan6ment a l'6tape de mise en presence de 
la proteine fluorescente fusionnee avec la proteine cible et d'un ligand de la 

35 susdite proteine, ce ligand 6tant marqu6 par un marqueur, ou 

- avant, ou apres, ou simultan6ment a l'6tape de mise en presence 
de cellule ou de fragments de cellules et d'un ligand de la susdite proteine, 
marqu6 par un marqueur, 
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10 



15 



20 



25 



30 



35 



cette 6tape supplementaire consistant : 

- soit a mettre la susdite proline fluorescente fusionnee avec la 
proline cible en pr6sence du susdit ligand non marqud et simultan6ment du 
susdit ligand marqu6, 

- soit a mettre en presence les susdites cellules ou les susdits 
fragments de cellules en presence simultanee du susdit ligand non marque et du 
susdit ligand marqu6, 

- on detecte soit une diminution d'amplicude de remission du 
donneur et/ou un signal d'6mission caract6ristique de remission de 1'accepteur, 
respectivement dans le cas de ['utilisation du ligand marque et dans le cas de 
l'utilisation simultan6e du ligand marque et du ligand non marqu6, 

- et on compare soit les diminutions d' amplitude de remission du 
donneur respectivement obtenues et/ou les signaux d'emission caract6ristiques 
de l'6mission de 1'accepteur respectivement obtenus. 

13. Proc6d6 selon la revendication 12, dans lequel la proteine 
fluorescente est EGFP et dans lequel : 

- soit la EGFP est donneur d'energie de fluorescence et le 
marqueur est accepteur d'energie de fluorescence et est choisie parmi des 
substances, dont le spectre d'excitation chevauche le spectre d'emission de la 
EGFP, et notamment dans le cas ou le marqueur est une substance fluorescente, 
il est choisi parmi : le 4,4-difluoro-4-bora-3a,4a-diaza-s-indacene (Bodipy), 
I'eosine* Firythrosine, la t6tram6thylrhodamine, la sulforhodamine 101 
commercialis6e par Molecular probe sous la denomination Texas Red, et leurs 
denv6s permettent d'une part le greffage et, d'autre part, dont le spectre 
d'excitation recouvre le spectre d'emission de EGFP, 

et dans le cas ou le marqueur n'est pas une substance 
fluorescente, il est choisi parmi le groupe des acides violets [Acid 
Violet 5, CAS 10130-48-0 ; Acid Violet 7, CAS 4321-69-1 ; 
Acid Violet 17, CAS 4129-84-4], acides rouges [Acid Red 1, 
CAS 3734-67-6 ; Acid Red 8, CAS 4787-93-3 ; Acid Red 37, 
CAS 6360-07-2 ; Acid Red 40, CAS 12167-45-2 ; Acid Red 106, 
CAS 6844-74-2 ; Acid Red 114, CAS 6459-94-5], les alizarines, 
l'aluminon, l'azocarmine B [CAS 25360-72-9], la fuschine 
basique [Basic Red 9, CAS 569-61-9], le Bordeaux R [Acid Red 
17, CAS 5858-33-3], la Carmine [CAS 1390-65-4], 

- soit la EGFP est accepteur d'6nergie de fluorescence et la 
substance fluorescente est donneur d'energie de fluorescence et est choisie parmi 
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des substances, dont le spectre d' emission chevauchc le spectre d'excitation de 
la EGFP, et notamment parmi : les coumarines, la fluorescamine, le 6-(N- 
m6thylaniiino)naphtalene, (mansyl) et leurs derives permettent d'une part le 
greffage et, d'autre part, dont le spectre d'emission recouvre le spectre 
5 d'excitation de EGFP. 

14. Procede selon 1'une des revendications 10 a 13, dans lequel la 
proteine dont on veut determiner 1' interaction proteine-ligand est choisie parmi: 

- les r6cepteurs membranaires couples a la proteine G, notamment 
10 dans Supplement Trends in Pharmacological Sciences, 1997 (Receptor and ion 

Channel Nomenclature), 

- les recepteurs des facteurs de croissance, notamment ceux qui 
sont structurellement relies au recepteur de 1'insuline (Yarden, Y. and Ullrich, 

15 A . 1988 , Biochemistry 22:3 1 13-3119) ou au recepteur de 1 ' interferon y (Brisco, 
J. et al. 1996, Phylos. Trans. R. Soc. Lond. B. Biol. Sci. 251: 167-171 ; Ihle, 
J.N. 1995, Nature 22Z:591-594), 

- les rScepteurs canaux, notamment dans Supplement Trends in 
Pharmacological Sciences, 1997 (Receptor and ion Channel Nomenclature), 

20 - les r6cepteurs nucleaires intracellulaires, notamment ceux qui sont 

structurellement relies au recepteur des steroides"(Mangelsdorf et al. 1995, Cell, 
£2:835-839 ; Wurtz, J.L. et al. 1996, Nature Struct. Biol. 2:206). 

15. Precede selon l'une des revendications 10 a 14, dans lequel la 
25 proteine fluorescente est la EGFP et la substance marqu6e est le Bodipy et dans 

lequel on detecte soit la diminution d'amplitude d'emission de la EGFP, soit le 
signal d'emission du Bodipy r6sultant du transfert d'energie, la longueur d'onde 
d' irradiation correspondant a la longueur d'onde d'excitation de la EGFP. 

30 16. PrOc6d6 selon Tune des revendications 10 a 15, dans lequel la 

proteine fluorescente est la EGFP et la substance marquee est une coumarine et 
dans lequel on d6tecte soit la diminution d'amplitude de la coumarine, soit le 
signal d'dmission de la EGFP r6sultant du transfert d'energie, la longueur 
d'onde d'irradiation correspondant a la longueur d'onde d'excitation de la 

35 coumarine. 
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17. Procede selon l'une des revendications 10 a 16, dans lequel la 
proline fluorescente est fusionn6e du cdte" N-terminal et la proteme cible, 
notamment le recepteur, est fusionn6 du cote C-terminal. 

18. Prac6d6 selon l'une des revendications 10 a 17, dans lequel la 
proteine fluorescente est fusionnee du c6te C-terminal et la proteine cible, 
notamment le recepteur, est fusionn6 du c6t6 N-terminal. 

19. Procede selon l'une des revendications 10 a 18, dans lequel la 
proteine fluorescente est inser6e dans la proline cible a un endroit ne 
correspondant pas a un site de liaison proteme cible-ligand, notamment dans le 
cas des r6cepteurs couples a la prot6ine G, cette insertion ayant lieu dans la 
premiere ou la troisieme boucle intracellulaire du recepteur, sous reserve que 
1' insertion ne ddtruise ni les proprietds du recepteur, ni la fluorescence de la 
proteine fluorescente. 

20. Proc6de selon l'une des revendications 10 a 19, dans lequel les 
cellules sont des cellules de mammiferes, notamment les cellules HEK 293 
adherentes ou en suspension, cellules CHO, cellules COS, lign6es 
lymphocytaires, fibroblastes, etc., ou des cellules de levure, notamment pichia 
telle que pichia pastoiis, saccharomyces telle que saccharomyces cerevisia, 
saccharomyces kluyveri, Hansenula telle que hansenula polymorpha, ou des 
cellules d'insectes infect6es par un virus tel que baculovirus, notamment cellules 
TNI ou sf9, ou des champignons, notamment les souches de Aspergillus (A. 
oryzae, A. nidulans, A. niger), Neurospora, Fusarium, Trichoderma. 

21. Proc&ie selon l'une quelconque des revendications 10 a 20, dans 
lequel un signal est detectable, dans un appareil de fluorimettie conventionnel 
ou dans un appareil de m61ange rapide 6quipe d'un systeme de d6tection de 
fluorescence, apres m61ange du donneur et de l'accepteur et peut 6tre aboli par 
1'addition d'une substance non fluorescente de meme sp6cificite 
pharmacologique, et notamment dans lequel le rapport signal/bruit est sup6rieur 
a environ 2. 

22. Utilisation d'un proteme fluorescente choisie parmi les proteines 
fluorescentes issues ou denvees de proteines autdfluorescentes de cnidaires, 
dont le coefficient d' extinction mol6culaire est sup6rieur a environ 
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MOOOM'W" 1 et le rendement quantique de fluorescence est sup6rieur k environ 
0,38, notamment choisie parrni : 

- la proteine fluorescente verte (GFP), ou 

- des variants derives de ia GFP, par addition, d616tion ou 
5 substitution d'un ou plusieurs acides amines, sous reserve que ces variants 

conservent la propri6te de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la proprtete de fluorescence, 

pour la detection et la quantification d' interactions non covalentes entre une 
10 prot6ine cible constitude par un r6cepteur couplS aux proteines G et une prot6ine 
G, en vue d* identifier les molecules biologiquement actives vis-&-vis du 
recepteur, susceptibles de former une interaction non covalente reversible avec 
ledit recepteur, ledit recepteur 6tant marqu£ par voie g6n£tique par la proline 
fluorescente et la proteine G 6tant marqu6e par un marqueur constitu6 : 
15 - soit par une molecule susceptible d' absorber la lumiere eraise par 

la proline fluorescente, 

- soit par une substance fluorescente pouvant etre notamment 
choisie parmi les proteines fluorescentes issues ou dSrivees de proteines 
autofluorescentes de cnidaires, dont le coefficient d' extinction mol6culaire est 

20 sup6rieur a environ MOOOM^cm" 1 et le rendement quantique de fluorescence est 
sup6rieur a environ 0,38, notamment choisie parmi : 

- la prot6ine fluorescente verte (GFP), ou 

- des variants d6riv6s de la GFP, par addition , d616tion ou 
substitution d ! un ou plusieurs acides amines, sous reserve que ces variants 

25 conservent la propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la propri6t6 de fluorescence, 

cette d6tection et quantification ay ant lieu par transfert d'6nergie de 
fluorescence entre le recepteur marqu6 par la GFP ou Tun de ses 

30 variants d6finis ci-dessus, ou Tun des fragments d6finis ci-dessus et 

la susdite substance fluorescente, la substance fluorescente 6tant telle 
que soit elle est excitable a la longueur d f onde demission de la GFP 
ou de Tun des susdits variants, ou de Tun des susdits fragments, soit 
elle 6met k la longueur d* excitation de la GFP, ou de run des susdits 

35 variants, ou de Tun des susdits fragments, ou 

. entre la GFP ou fun de ses variants d6finis ci-dessus, ou fun des 
fragments d6finis ci-dessus, et la susdite mol6cule susceptible 
d'absorber la lumiere 6mise par la proteine fluorescente. 
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23. Utilisation (Tune prot6ine G marquee par un marqueur constitue: 

- soit par une molecule susceptible d' absorber la lumiere emise par 
la prot6ine fluorescente, 

5 - soit par une substance fluorescente pouvant 6tre notamment 

choisie parmi les proteines fluorescentes issues ou derivees de proteines 
autofluorescentes de cnidaires, dont le coefficient d* extinction moteculaire est 
sup6rieur k environ UOOOM^cm* 1 et le rendement quantique de fluorescence est 
superieur a environ 0,38, notamment choisie parmi : 
10 - la proteine fluorescente verte (GFP), ou 

- des variants derives de la GFP, par addition , delation ou 
substitution d'un ou plusieurs acides aminds, sous reserve que ces variants 
conservent la propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
15 sous reserve que ces fragments conservent la propridte de fluorescence, 

pour la detection et la quantification d' interactions non covalentes entre une 
prot&ne cible constitute par un r6cepteur coupl6 aux prolines G et la susdite 
proline G, en vue d' identifier les molecules biologiquement actives vis-^-vis du 
r6cepteur, susceptibles de former une interaction non covalente reversible avec 

20 ledit recepteur, ledit r6cepteur 6tant marqud par voie g6n6tique par une proline 
fluorescente choisie parmi les prolines fluorescentes issues ou d6riv6es de 
prolines autofluorescentes de cnidaires dont le coefficient d' extinction 
moleculaire est sup6rieur a environ 14000M* l cm" 1 et le rendement quantique de 
fluorescence est sup6rieur a environ 0,38, notamment choisie parmi : 

25 - la proteine fluorescente verte (GFP) , ou 

- des variants d6riv6s de la GFP, par addition, d616tion ou 
substitution d'un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propri6t6 de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
30 sous reserve que ces fragments conservent la propri6t6 de fluorescence, 

cette detection et quantification ayant lieu par transfert d'dnergie de 
fluorescence: 

. entre la GFP ou Tun des variants d6finis ci-dessus, ou Tun des 
fragments definis ci-dessus et la susdite substance fluorescente, la 
35 substance fluorescente 6tant telle que soit elle est excitable k la 

longueur d'onde d ! 6mission de la GFP ou de Tun des susdits 
variants, ou de Tun des susdits fragments, soit elle 6met k la 
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longueur d'excitation de la GFP, ou de Tun des susdits variants, ou 
de Tun des susdits fragments, ou 

. entre la GFP ou Tun de ses variants ddfinis ci-dessus, ou Tun des 
fragments d6finis ci-dessus, et la susdite molecule susceptible 
5 d' absorber la lumiere 6mise par la prot6ine fluorescente. 

24. Utilisation selon la revendication 22 ou 23, dans laquelle la proteine 
fluorescente est choisie parmi EGFP, ECFP, EYFP, ou leurs mutants pour 
lesquels le coefficient d' extinction moleculaire est sup6rieur a environ 

10 14000 M^cm* 1 et le rendement quantique est sup6rieur a environ 0,38. 

25. Utilisation selon Tune des revendications 22 ou 24, dans laquelle le 
r6cepteur est choisi parmi : 

- les r6cepteurs couples aux proteines G, notamment ceux decrits 
15 dans Supplement Trends in Pharmacological Sciences, 1997 {Receptor and ion 

Channel Nomenclature) , 

- les sequences codant pour des recepteurs coupl6s aux prolines G 
putatifs dont les molecules biologiquement actives vis-i-vis d'eux-memes sont k 
identifier, notamment choisies parmi les sequences de r6cepteur orphelins 

20 disponibles dans les banques de sequence Genbank, EMBL et banques afAU6es, 

26. Utilisation selon la revendication 23, dans laquelle la prot6ine G est 
choisie parmi les prolines G d6crites dans Journal of Receptor Research, vol 
13, ppl9-26, 1993 ou Angewandte Chemie, ed. Engl, vol 34, ppl406-1419, 

25 1995. 

27. Proc6d6 de detection et de quantification d f interactions non 
covalentes entre une proteine cible constitu6e par un r6cepteur couple aux 
prot6ines G et une proteine G, en vue d 1 identifier les mol6cules biologiquement 

30 actives vis-£-vis du r6cepteur, susceptibles de former une interaction non 
covalente reversible avec ledit r6cepteur , caract6ris6 en ce que : 

- on pr6pare des cellules soit des fragments de cellules exprimant 
une s6quence d'ADN comprenant le gfene codant pour une prot6ine fluorescente 
fusionnee avec le gfcne du r6cepteur coupl6 aux proteines G, la fusion entre le 

35 gfcne de la proteine fluorescente et le gfene du susdit r6cepteur dtant telle que les 
propri6t6s du rdcepteur ne sont pas modifies par la presence de la protdine 
fluorescente, a savoir : 

* 1' interaction entre le r6cepteur et la prot6ine G n f est pas modifiee, 
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* 1' interaction entre le recepteur et la molecule biologiquement active 
n'est pas modifi6e, 

* la fonction de transduction de la reponse n'est pas modifi6e, 

la proteine fluorescente etant choisie parmi les proteines fluorescentes 
5 issues ou derivees de proteines autofluorescentes de cnidaires dont le 

coefficient d' extinction moleculaire est superieur a environ 14000M" 
'cm -1 et le rendement quantique de fluorescence est sup6rieur a 
environ 0,38, notamment choisie parrni : 

- la proteine fluorescente verte (GFP), ou 

10 " des variants derives de la GFP, par addition , deletion ou 

substitution d'un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propriete de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
sous reserve que ces fragments conservent la propriete de fluorescence, 

15 la proteine G 6tant marquee par un marqueur constitu6 : 

- soit par une molecule susceptible d'absorber la lumiere 6mise par 
la proteine fluorescente, 

- soit par une substance fluorescente, 

- la proteine fluorescente et le susdit marqueur etant tels qu'ils 
peuvent transferer l'energie de Tun a 1'autre, la proteine fluorescente pouvant 
etre donneur d'6nergie ou le susdit marqueur pouvant etre donneur d'energie, 
Tinteraction entre le recepteur marque par la prot6ine fluorescente et la prot6ine 
G marquee par un marqueur susd6fini 6tant d6tectee par transfert d'energie de 
fluorescence. 



-20 



25 



28. Proc6d6 d' identification et eventuellement de quantification 
d'interactions entre un r6cepteur et une molecule non fluorescente 
biologiquement active vis-a-vis dudit r6cepteur, susceptibles de former une 
interaction non covalente r6versible avec ledit recepteur, par mise en oeuvre du 
30 precede selon la revendication 27, dans lequel une mol6cule non fluorescente 
biologiquement active est ajout6e a des cellules, ou fragments de cellules, 
exprimant l'ADN codant pour le recepteur marqu6 par la proteine fluorescente 
et pour la proteine G marqu6e par le marqueur, caract6ris6 en ce que : 

- une molecule non fluorescente biologiquement active et agoniste 
declenche une transduction de signal detectee par variation de transfert d'6nergie 
entre le recepteur marqud par la proteine fluorescente et la proteine G marquee 
par le marqueur ; 
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- une molecule rion fluorescente biologiquement active antagoniste 
inhibe la transduction de signal provoqude par un agoniste et detectee par 
variation de transfert d'dnergie de fluorescence entre le rdcepteur marqud par la 
protdine fluorescente et la prot6ine G marqu6e par le marqueur. 

5 

29. Cellules ou fragment de cellules contenant une sequence d'ADN 
comprenant le gene codant pour une protdine fluorescente fusionnde avec le 
gene d'une proline cible, la proteine fluorescente dtant choisie parmi les 
proteines fluorescentes issues ou ddrivdes de prolines autofluorescentes de 
LO cnidaires, dont le coefficient d 1 extinction moleculaire est supdrieur k environ 
MQOOM^cm^et le rendement quantique de fluorescence est supdrieur k environ 
0,38, la fusion entre le gfene de la proteine fluorescente et le gdne de la susdite 
protdine cible dtant telle que 

* les propridtds de la protdine cible ne sont pas modifies par la 
15 presence de la proteine fluorescente, k savoir 

* T interaction entre la proline cible et le ligand n'est pas modifiee, 

* la fonction de transduction de la rdponse n'est pas modifiee, 

sous reserve que : 

. * lorsque la proteine cible est le r6cepteur des glucocorticoides de 
20 rat fusionnd en N-terminal avec successivement une sequence de 

purification comportant 6 histidines, un dpitope hdmaglutinine et 
une proline fluorescente et est exprimee dans la lignde cellulaire 
1471.1, la proteine fluorescente est diffdrente de la GFP (768 
paires de bases du plasmide TU65 avec la mutation S65T), 
25 * lorsque la protdine cible est le rdcepteur humain des 

glucocorticoides tronqu6 de ses 131 premiers amino acides, 
fusionnd en C-terminal d'une protdine fluorescente dans les sites 
Sal I et BamH 1 et est exprimde dans les cellules Cos-1, ladite 
protdine fluorescente est diffdrente de la GFP telle que ddcrite 
30 dans Tarticle de Inouye S. et Tsuji, F. I., 1994, Febs Letters, 

Vol. 341,p.277-280, 
* lorsque la proteine cible est la sous-unite NMDA Rl de rat 
exprimd dans les cellules HEK 293 fusionnde en C-terminal avec 
une protdine fluorescente, la protdine fluorescente est diffdrente 
35 de ceile constituee par les acides aminds 2-238 de la GFP 

sauvage, 
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* lorsque la protSine cible est un r6cepteur ou un fragment de 
recepteur de messagers secondaires intracellulaires, la proteine 
fluorescente est diff6rente de la GFP et de ses derives. 

5 30. Cellules ou fragment de cellules contenant une s6quence d'ADN 

comprenant le gene codant pour une substance fluorescente fusionn6e avec le 
gene d'un ligand, la substance fluorescente 6tant choisie parmi les proteines 
fluorescentes issues ou d6riv6es de proteines autofluorescentes de cnidaires, 
dont le coefficient d* extinction moleculaire est superieur k environ MOOOM^cm" 

10 l et le rendement quantique de fluorescence est sup6rieur k environ 0,38, la 
fusion entre le gene de la substance fluorescente et le gene du ligand 6tant tel 
que 

* les propri6t6s du ligand ne sont pas modifies par la presence de 
la substance fluorescente, k savoir 

15 * Tinteraction entre la proteine cible et le ligand n'est pas modifiee, 

* la fonction de transduction de la r6ponse n'est pas modifi6e. 

31. Cellules ou fragment de cellules contenant une sequence d'ADN 
comprenant 

20 - le gfene codant pour un ligand constitue par la prot&ne G 

fiisionnte avec une substance fluorescente choisie parmi les proteines 
fluorescentes issues ou deriv6es de proteines autofluorescentes de cnidaires, 
dont le coefficient d'extinction mol6culaire est sup6rieur k environ MOOOM^cm* 
*et le rendement quantique de fluorescence est sup6rieur k environ 0,38, 

25 - et eventuellement le gfene codant pour une proteine fluorescente 

fusionn6e avec le g&ne d'une proline cible constitute par un r6cepteur, la 
proteine fluorescente 6tant choisie parmi les proteines fluorescentes issues ou 
d6rivees de prot6ines autofluorescentes de cnidaires, dont le coefficient 
d 1 extinction mol6culaire est sup6rieur k environ MOOOM 'cm^et le rendement 

30 quantique de fluorescence est sup6rieur k environ 0,38, 

- la fusion entre le g&ne de la substance fluorescente et le g&ne de 
la susdite prot6ine G, et 6ventuellement la fusion entre le gfene de la proteine 
fluorescente et le gfene du recepteur 6tant telle que 

■* les propri6tes de la prot6ine G ne sont pas modifiees par la 

35 pr6sence de la substance fluorescente, 

* les propri6t6s du recepteur ne sont pas modifies par la presence 
de la prot6ine fluorescente, a savoir 

* Tinteraction entre la prot6ine G et le r6cepteur n'est pas modifi6e, 
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* la fonction de transduction de la rdponse n'est pas modifi6e, sous 
reserve que : 

* lorsque la proteine cible est le recepteur des glucocorticoides de 
rat fusionn6 en N-terminai avec successivement une sdquence de 

5 purification comportant 6 histidines, un 6pitope h6maglutinine et 

une proteine fluorescente et est exprim6e dans la Hgn6e cellulaire 
1471.1, la prot6ine fluorescente est diff6rente de la GFP (768 
paires de bases du plasmide TU65 avec la mutation S65T), 

* lorsque la proteine cible est le rdcepteur huraain des 
L0 glucocorticoides tronqu6 de ses 131 premiers amino acides, 

fusionn6 en C-terminal d'une proteine fluorescente dans les sites 
Sal I et BamH I et est exprim6e dans les cellules Cos-1, ladite 
prot6ine fluorescente est diff6rente de la GFP telle que dScrite 
dans V article de Inouye S. et Tsuji, F. I., 1994, Febs Letters, 
15 Vol. 341, p.277-280, 

* lorsque la proline cible est la sous-unit6 NMDA Rl de rat 
exprim6 dans les cellules HEK 293 fiisionn6e en C-terminal avec 
une proteine fluorescente, la proline fluorescente est differente 
de celle constitute par les acides amines 2-238 de la GFP 

20 sauvage, 

* lorsque la prot6ine cible est un rficepteur ou un fragment de 
r6cepteur de messagers secondaires intracellulaires, la proteine 
fluorescente est diff6rente de la GFP et de ses deriv6s. : 

25 32. Trousse ou nScessaire pour la d6tection et la quantification 

d 1 interactions non covalentes entre une proline cible marqu6e par une proline 
fluorescente et Tun de ses ligands marqufe par un marqueur constitu6 : 

- soit par une molecule susceptible d'absorber la lumifere 6mise par 
la proteine fluorescente, 
30 ^ soit par une substance fluorescente, 

laquelle prot6ine fluorescente est choisie parmi les prolines fluorescentes issues 
ou d£rivees de prot6ines autofluorescentes de cnidaires, dont le coefficient 
d* extinction moteculaire est sup6rieur k environ 14000M" l cm- 1 et le rendement 
quantique de fluorescence est sup6rieur a environ 0,38, notamment choisie 
35 parmi : 

- la proline fluorescente verte (GFP), ou 
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- des variants derives de la GFP, par addition, d61etion ou 
substitution d ! un ou plusieurs acides amines, sous reserve que ces variants 
conservent la propri6te de fluorescence, 

- ou des fragments de la GFP, ou de fragments des susdits variants, 
5 sous reserve que ces fragments conservent la propri6t6 de fluorescence et son 

ligand marque par une substance fluorescente, ladite trousse comprenant : 

- la proline cible fiisionnee avec une prot6ine fluorescente ou une 
lign6e cellulaire stable susceptible d'exprimer la prot6ine fusionnee avec une 
proteine fluorescente ou un plasmide contenant la s6quence nucl6ique codant 

10 pour ladite proteine cible fusionn6e avec une proteine fluorescente telle que 
d6fmie ci-dessus, 

- le ligand marqu6 par le susdit marqueur, 

- les tampons et milieux n6cessaires au transfert d'energie entre la 
susdite prot6ine et le susdit ligand. 

15 

33. Trousse ou n6cessaire pour la detection et la quantification 
d' interactions non covalentes entre une prot6ine cible marquee par une prot6ine 
fluorescente (n° 1) et Tun de ses ligand marqu6 par une substance fluorescente 
correspondant k une proteine fluorescente (n° 2), la prot6ine fluorescente (n° 1) 
20 6tant choisie parmi la prot6ine fluorescente EYFP ou EGFP et le ligand etant 
marqu6 par la proline fluorescente (n° 2) ECFP ou la proteine fluorescente 
(n° 1) 6tant ECFP et le ligand 6tant marqu6 par la prot6ine fluorescente (n° 2) 
EYFP ou EGFP, ladite trousse comprenant : 

- soit un plasmide contenant un acide nuci6ique codant pour la 
25 proteine cible fusionn6e avec une proline fluorescente (n° 1), et 

* un plasmide contenant un acide nucl6ique codant pour le ligand 
fusionn6 avec une proteine fluorescente (n° 2), ou 

* un ligand fusionn6 avec une proteine fluorescente (n° 2), 
obtenu par voie recombinante et purifie, 

30 - soit une lignee cellulaire stable susceptible d'exprimer la prot6ine 

cible fusionnde avec une proteine fluorescente (n° 1), et 

* une lignee cellulaire stable susceptible d'exprimer le ligand 
fusionn6 avec une proteine fluorescente (n° 2), ou 

* un ligand fusionnd avec une prot6ine fluorescente (n° 2), 
35 obtenu par voie recombinante et purifi6, 

- les tampons et milieux n6cessaires au transfert d'6nergie entre la 
susdite proline et le susdit ligand. 
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34. Trousse ou necessaire pour la detection et la quantification 
d' interactions non covalentes entre une proteine cible constitu6e par un 
recepteur coupld a la proteine G marqu6e par une proteine fluorescente 

5 (n° 1) et la proteine G marquee par une substance fluorescente correspondant k 
une proline fluorescente (n° 2), la proline fluorescente (n° 1) 6tant choisie 
parmi la proline fluorescente EYFP ou EGFP et la proline G 6tant marquee 
par la proteine fluorescente (n° 2) ECFP ou la proline fluorescente (n° 1) 6tant 
ECFP et la proline G 6tant marqu6e par la proteine fluorescente (n° 2) EYFP 

10 ou EGFP, ladite trousse comprenant : 

- soit un plasmide contenant un acide nucleique codant pour le 
rdcepteur fusionn6 avec une protdine fluorescente (n° 1), et 

* un plasmide contenant tin acide nucl&que codant pour la 
prot6ine G fusionnde avec une proteine fluorescente (n° 2), ou 

15 * la proline G fusionnde avec une proteine fluorescente 

(n° 2), obtenue par voie recombinante et purifiee, 

- soit une lign6e cellulaire stable susceptible d'exprimer le 
recepteur fiisionnd avec une proline fluorescente (n° 1), et 

* une lignde cellulaire stable susceptible d'exprimer la proteine 
20 G fusionnde avec une proline fluorescente (n° 2), ou . 

* la prot6ine G fusionnde avec une proline fluorescente 
(n° 2), obtenue par voie recombinante et purifiee, 

- les tampons et milieux n6cessaires au transfert d'dnergie entre le 
susdit recepteur et la susdite proline G. 
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